Learn more about Search Results A - Page 299

バイトダンスとCMUの研究者は、AvatarVerseを紹介しますテキストの説明とポーズガイダンスの両方で制御される高品質な3Dアバターを生成するための新しいAIパイプラインです

3Dアバターは、ゲーム開発、ソーシャルメディアとコミュニケーション、拡張現実と仮想現実、および人間とコンピューターのインタラクションなど、様々な産業で広範に使用されています。高品質な3Dアバターの構築は、多くの関心を引き寄せています。これらの複雑な3Dモデルは従来、手作業で作成されており、訓練を受けたアーティストが数千時間をかけて作業する必要があります。このため、自然言語の説明だけを使用して高品質な3Dアバターの作成を自動化することが研究上のポテンシャルとリソースの節約につながると考えられています。 最近、マルチビュー映像やリファレンス写真から高品質な3Dアバターを再構築する技術には多くの注目が集まっています。ただし、これらの技術は、映画やリファレンス画像から得られた制約のあるビジュアルプライオリティに依存しているため、複雑なテキストの提示に基づいて想像力豊かなアバターを作成することはできません。拡散モデルは2D画像の生成時に驚くべき創造性を発揮しますが、多くの大規模なテキスト-イメージの組み合わせが利用可能であるためです。しかし、多様性の欠如と3Dモデルの不足により、3D拡散モデルの適切なトレーニングが困難です。 最近の研究では、事前に訓練されたテキスト-イメージ生成モデルを使用して高品質な3Dモデルを生成するためにニューラル放射線場を最適化することに焦点を当てています。しかし、ポーズや外見、形状が異なる堅牢な3Dアバターの作成はまだ困難です。一般的なスコア蒸留サンプリングを使用してNeRF最適化を指示する追加の制御なしに行うと、ジャヌスの問題が発生する可能性があります。さらに、現行の方法によって作成されたアバターは、しばしば粗さやぼやけが目立ち、高解像度の局所的なテクスチャの詳細やアクセサリーなどの重要な要素が欠けてしまいます。 ByteDanceとCMUの研究者は、これらの制約に対処するために、テキストの説明と位置のガイダンスだけを使用して高品質で信頼性のある3Dアバターを生成するための独自のフレームワーク「AvatarVerse」を提案しています。彼らはまず、800K以上の人間のDensePose画像を使用して新しいControlNetを訓練します。その後、ControlNetの上に2D DensePose信号に依存したSDS損失を実装します。これにより、すべての2Dビューと3D空間、および多くの2Dビュー間で正確なビュー対応が実現されます。彼らの技術は、以前のアプローチの大部分に影響を与えるジャヌスの問題を解消し、作成されたアバターのポーズ制御も可能にします。その結果、アバターの生成手順の信頼性と一貫性が保証されます。また、DensePoseによって提供される正確で適応性のある監視信号により、生成されたアバターはSMPLモデルの関節と良好に整列し、骨格のバインディングと制御が容易で効率的に行えます。 彼らは、局所的なジオメトリのリアリズムと詳細を向上させるためのプログレッシブな高解像度生成技術を提案しています。DensePoseに依存したControlNetだけを頼りにすると、局所的なアーティファクトが生じる場合があります。彼らは、計算効率の高い明示的なニューラル放射線場内の密度ボクセルグリッドの滑らかな勾配を促進するスムーズネス損失を使用して、作成されたアバターの粗さを減らします。 以下は、全体的な貢献内容です: • 「AvatarVerse」を紹介し、単語の説明と参考人物の姿勢だけを使用して高品質な3Dアバターを自動的に作成する手法を提供します。 • ポーズに対応した3Dアバターの作成を容易にし、システムの安定性を向上させるためのDensePose-Conditioned Score Distillation Sampling Lossを提供します。 • 徹底的な高解像度生成プロセスにより、生成された3Dアバターの品質を向上させます。この技術は、手の部分、アクセサリーなどの細部を含む、厳密な粗いから細かい微調整プロセスを通じて、詳細にわたる3Dアバターを作成します。 • AvatarVerseは、品質と安定性の面で競合他社を凌駕します。徹底的なユーザー調査に基づく緻密な定性評価によって、高品質な3Dアバターの生成におけるAvatarVerseの優位性が示されています。 これにより、信頼性の高いゼロショット3Dアバター生成の新たな基準が設定されます。彼らは自分たちの技術のデモをGitHubのウェブサイトで公開しています。

AgentBenchをご紹介します:さまざまな状況で大規模な言語モデルをエージェントとして評価するために開発された多次元ベンチマークです

大規模言語モデル(LLM)は登場し、進化し、人工知能の分野に複雑さの新たなレベルを加えました。徹底的なトレーニング方法により、これらのモデルは驚くべき自然言語処理、自然言語理解、自然言語生成のタスクをマスターしました。質問に答える、自然言語の推論を理解する、要約するなどのタスクです。また、NLPに一般的に関連付けられていない、人間の意図を把握し、指示を実行するなどの活動も達成しています。 LLMを使用して自律的な目標を達成するAutoGPT、BabyAGI、AgentGPTなどのアプリケーションは、すべてのNLPの進歩のおかげで可能になりました。これらのアプローチは一般の人々から多くの関心を集めていますが、LLMを評価するための標準化されたベースラインの欠如は依然として重要な障害となっています。過去にはテキストベースのゲーム環境が言語エージェントを評価するために使用されてきましたが、それらは制約された離散的な行動空間を持つため、しばしば欠点があります。また、それらは主にモデルの常識的な根拠の能力を評価します。 エージェントのための既存のベンチマークのほとんどは特定の環境に焦点を当てているため、さまざまなアプリケーションコンテキストでLLMを徹底的に評価する能力が制限されています。これらの問題に対処するために、清華大学、オハイオ州立大学、UCバークレーの研究者チームがエージェントベンチを導入しました。エージェントベンチは、さまざまな設定でLLMをエージェントとして評価するために作成された多次元ベンチマークです。 エージェントベンチには8つの異なる設定が含まれており、そのうち5つは新しいものです。横思考パズル(LTP)、知識グラフ(KG)、デジタルカードゲーム(DCG)、オペレーティングシステム(OS)、データベース(DB)、知識グラフです。最後の3つの環境(家事(Alfworld)、オンラインショッピング(WebShop)、ウェブブラウジング(Mind2Web))は既存のデータセットから適応されています。これらの環境はすべて、テキストベースのLLMが自律的なエージェントとして行動できる対話的な状況を表現するよう慎重に設計されています。これらは、コーディング、知識獲得、論理的な推論、指示の従順さなど、主要なLLMのスキルを徹底的に評価するための厳密なテストベッドとして機能し、エージェントとLLMの両方を評価するためのものです。 研究者はAgentBenchを使用して、APIベースのモデルやオープンソースのモデルを含む25の異なるLLMを徹底的に分析し、評価しました。調査結果は、GPT-4などのトップモデルが幅広い実世界のタスクをうまくこなすことを示しており、高度に能力が高く、常に適応するエージェントの作成の可能性を示唆しています。ただし、これらのトップAPIベースのモデルは、オープンソースの同等モデルよりも明らかに性能が劣っています。オープンソースのLLMは他のベンチマークでは優れたパフォーマンスを発揮しますが、AgentBenchの困難なタスクが提示されると、大きな困難に直面します。これは、オープンソースのLLMの学習能力を向上させるための追加の取り組みが必要であることを強調しています。 貢献は以下のようにまとめられます: AgentBenchは、標準化された評価手順を定義し、LLMをエージェントとして評価する革新的なコンセプトを導入する徹底的なベンチマークです。それは8つの本物の環境を統合し、実世界の状況をシミュレートすることで、LLMのさまざまな能力を評価するための有用なプラットフォームを提供します。 この研究では、AgentBenchを使用して25の異なるLLMを徹底的に評価し、主要な商用APIベースのLLMとオープンソースの代替品との間に大きなパフォーマンスの差があることを明らかにしました。この評価は、LLM-as-Agentの現状を強調し、改善の余地がある領域を特定しています。 この研究では、AgentBench評価手順のカスタマイズを容易にする「API&Docker」相互作用パラダイムに基づいた統合ツールセットも提供されています。このツールセットの提供は、関連するデータセットと環境とともに、LLMの研究開発における共同研究と開発を促進します。

「ZoomがAIトレーニングのために顧客データを使用することで法的ジレンマに直面」

新たな出来事の展開により、人気のあるビデオ会議プラットフォームであるZoomが、顧客データを人工知能(AI)モデルのトレーニングに使用することに関する法的なジレンマに巻き込まれています。この論争は、最近の利用規約を中心に展開しており、ユーザーの憤りを引き起こし、データプライバシーや同意に関する重要な問題を提起しています。Zoomのデータの取り扱いとそのユーザーや広範なデジタル環境への潜在的な影響について、私たちと一緒に解析してみましょう。 また読む:ZoomがAIを統合してシームレスなビデオ会議を実現 虚偽の歴史再考:Zoomのセキュリティに関する苦闘 Zoomの法的なトラブルは新しい現象ではありません。3年前、同社は連邦取引委員会(FTC)との間で、セキュリティに関する主張に関連する欺瞞的なマーケティングの告発について和解しました。この告発は、暗号化の強度を過大評価したという主張に基づいています。現在に至るまで、Zoomはプライバシーポリシーや顧客データのAIモデルトレーニングに関する別の法的な問題に直面しています。 また読む:ChatGPTが潜在的な被害のために連邦取引委員会によって調査される プライバシーの論争:一連の出来事 最近の論争は、2023年3月に追加されたZoomの利用規約内に埋め込まれた条項を中心に展開しています。Hacker Newsの投稿によって明らかにされたこの条項は、顧客データをAIモデルのトレーニングに利用することを許可しているように見えますが、オプトアウトのオプションを提供していません。この事実により、ソーシャルメディア上での激しい怒りの嵐が巻き起こり、プライバシーやデータの使用に関する懸念が高まりました。 また読む:ジェネラティブAIツールを使用する際のプライバシー保護の6つの手順 法的用語の解析:条項は何を意味するのか? より詳細な調査の結果、一部の専門家は、議論の的となっている「オプトアウト不可」の条項がZoomが「サービス生成データ」と呼ぶものにのみ適用されると示唆しています。これには、テレメトリデータ、製品利用データ、診断データが含まれます。ただし、この条項はプラットフォーム上でのすべてのユーザーの活動や会話を包括しているわけではないようです。それにもかかわらず、この論争は、顧客の入力を使用してAIモデルをトレーニングすることの潜在的な影響についての熱い討論を引き起こしました。 また読む:オンライン投稿はすべてAIのもの、とGoogleが発表 プライバシーの懸念と潜在的な仕事の重複 Zoomが顧客の入力を再利用してAIモデルのトレーニングを行う可能性には重大な懸念があります。AIの急速な進歩の時代において、そのようなデータが一部の仕事を不要にする可能性があるという恐れがあります。個人の貢献が生活に影響を与える可能性のある方法で使用されることは、この状況にさらなる複雑さをもたらします。 また読む:OpenAIのCEOサム・アルトマン:AIがその力を証明するにつれて仕事が危険にさらされる ヨーロッパの法的状況とGDPRの影響 Zoomの法的なジレンマは、ユーザーの憤りにとどまりません。ヨーロッパ連合のデータ保護法、例えば一般データ保護規則(GDPR)や電子プライバシー指令が関与してきます。これらの規制は、ユーザーデータを保護し、ユーザーが情報の利用方法に対して権利を持つための枠組みを確立しています。この論争は、Zoomの慣行がこれらの厳格なEUの法律に準拠しているかどうかについての疑問を投げかけています。 また読む:EUのAIアクトがAI規制の世界標準を確立、アジア諸国は慎重な姿勢を維持 Zoomの対応:明確化と矛盾 Zoomは、問題が拡大するにつれて、自社の立場を明確にするための更新と声明を発表しました。同社は、音声、ビデオ、チャットの顧客コンテンツは、同意なしにAIモデルのトレーニングに使用されることはないと強調しました。しかし、批評家は、Zoomが使用する言語が不明確であり、解釈の余地を残していると指摘しています。一部の場合において、同社の懸念の緩和の試みは、むしろ混乱をもたらす結果となりました。 法的枠組みの衝突:GDPR対ePrivacy 専門家は、Zoomの行動が米国のデータ保護の慣行とEUの法律を組み合わせていることを指摘しています。これは、特にGDPRで明記されている同意と目的制限の原則に関して、矛盾を引き起こしています。これらの枠組みの衝突は、Zoomのデータの取り扱いがヨーロッパの基準と一致するかどうかに影響を与えます。 また読む:アメリカ議会が行動を起こす:二つの新しい法案がAIの規制を提案 前進の道:未解決の問題と不確実性…

「データサイエンティストのためのMakeとMakefileガイド」

データサイエンティストは、今では彼らの機械学習アルゴリズムを展開するためにプロダクションコードを書くことが求められていますしたがって、私たちはソフトウェアエンジニアリングの基準と方法を認識して、私たちの…

「2023年のAi4カンファレンスでジェネレーティブAIが主役を務める」

これまでの数年間、人工知能(AI)の風景は劇的な進化を遂げてきましたこの連続的な進歩は、2023年8月7日から9日までラスベガスで開催された最新のAi4カンファレンスで示され、生成型AIが主役となりましたAi4 2022の振り返り昨年のAi4カンファレンスは、[…]

「ペンタゴンによって設立された生成AIの研究タスクフォース」

アメリカ国防総省は、生成AIの応用を指導するために新たなタスクフォースを設立しました国防総省によれば、タスクフォースリマは、チーフデジタル・AIオフィス(CDOA)の所管に属することになりますそのオフィス自体は、わずか...

「LLMランドグラブ:AWS、Azure、およびGCPがAIを巡って闘っている」

企業クラウドプラットフォーム間でのAIの優位性を競うレースが始まっています大手および中小のプロバイダーが自分たちの賭けをする中、過去の技術的な対立が急速な変化の時に教訓を提供しています

ホームブリューや仮想マシンなしでMacBook M1またはM2にHadoopをインストールする方法

「この記事では、ローカルのMacBook M1またはM2にHadoopを簡単にインストールする方法を紹介します私は、2020年製のMacBook Air M1(arm64)を使用し、メモリ8GB、MacOS Venturaを搭載しています...」

「Bard」を活用するための10の役立つ方法

「アイデアのブレストから旅行のスケジュール作成まで、Bardがあなたの仕事を手助けする10の方法をチェックしてみてください」

「AIが起業の創造的プロセスをどのように変えるのか」

人工知能(AI)は数十年前から存在しており、最初のバージョンは1955年に登場しましたそれ以来、さまざまな業界で進歩と統合が飛躍的に進んできました2023年、AIブームは急速かつ大規模になり、クラウドインフラは追いつくのに追いつけない状況に陥っています避けられない変化が続いています... AIがビジネススタートの創造的プロセスをどのように変えるのか 詳しくはこちら »

Find the right Blockchain Investment for you

Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.

Advertising with us