Learn more about Search Results による - Page 6
- You may be interested
- プリンストン大学とメタAIの研究者たちは...
- このAI論文は、’リラックス:エンド...
- MITの研究者らが、言語モデルの解読におい...
- 「デバイス内AIの強化 QualcommとMetaがLl...
- 「MFAを超えて:オクタがエンタープライズ...
- 🤗 Transformersでn-gramを使ってWav2Vec2...
- ドリームブースと出会う:主体駆動型テキ...
- 世界最大のオープンマルチリンガル言語モ...
- ペース、努力、スタミナ
- 「LP-MusicCapsに会ってください:データ...
- 予測モデルの構築:Pythonにおけるロジス...
- 「AIが医療におけるケースの結果を向上さ...
- 「 Omnivore に会いましょう:SiBORG Lab ...
- AIエントロピー:AIによって生成されるコ...
- 「Kerasを使用したニューラルネットワーク...
オムニヴァースへ:オープンUSDの強化によるAutodesk Mayaでの3Dワークフローは、フェレットの物語のようになる
エディター注:この投稿は、オムニバースへの参加の一部であり、アーティスト、開発者、企業が最新のOpenUSDおよびNVIDIAオムニバースを使用してワークフローを変革する方法に焦点を当てています。 3Dアートとデザインにおいて、効率的なワークフローは創造的なビジョンを迅速に実現するために不可欠です。 ユニバーサルシーンディスクリプション、またはOpenUSDは、これらのワークフローを強化するフレームワークであり、3Dの世界内での記述、組成、シミュレーション、コラボレーションを統一かつ拡張可能に提供します。 OpenUSDは、メディアおよびエンターテイメント、建築、エンジニアリング、製品デザイン、製造にわたるAutodeskの製品およびソリューションの中核技術です。 今週のAU 2023カンファレンスで発表された、最新のOpenUSDの更新により、Autodesk Mayaのアーティストや技術関係者はより高い制御と効率でOpenUSDアセットを作成および操作することができるだけでなく、より効率的かつ正確な3Dワークフローを保証することができます。 MayaとOpenUSDでデジタルと現実の世界をつなぎます 多くのクリエイターは、MayaとOpenUSDを使用して自分たちの3Dワークフローを推進しています。 Karol Osinskiは、ユニークで大胆かつエレガントなプロジェクトに取り組む建築およびデザイン会社であるS20Mの3Dアーティストです。建築の視覚化を作成する際の最大の課題は、デジタルの世界を現実の世界と一致させることです。 USDおよびMaya、SideFX Houdini、Epic GamesのUnreal Engineなどのクリエイティブツールを使用して、Osinskiはクライアントのために高品質なビジュアルを作成しながら建築ワークフローを加速しています。 オシンスキーのアッパーイーストサイドの20階テラスからの全景 「OpenUSDは、これまでにない形で異なるツールをつなぐ可能性を提供しています」とオシンスキーは述べています。「USDが初めてのユーザーにとってどれだけアクセスしやすく、デザインを非常に複雑にする機会を開くかが好きです」 「サーワード」ニースタットは、アニメーションと3Dの教育をビデオチュートリアルと業界トレーニングを通じてよりアクセス可能にすることを目指しています。彼のユニークなアニメーションワークフローの最初のステップは、カメラでアニメーションを行うことです。それからMayaでアニメーション作業を始める前に、Blenderを含む他の3DソフトウェアにUSDでエクスポートします。 サーワードのVFXロボットアニメーションの制作 NVIDIAの3DアーティストもMayaとOpenUSDのパワーを体験しています。テクニカルスペシャリストであるLee Fraserは、「フェレットテイルプロジェクト」をリードし、OpenUSDとジェネラティブAIによって可能になるキャラクターの作成とアニメーションのワークフローを紹介しました。 デモを作成するために、Fraserと彼のチームは、Blender、Autodesk Maya、Reallusion Character…
「リトリーバル増強生成によるジェネラティブAIの最適化:アーキテクチャ、アルゴリズム、およびアプリケーションの概要」
この記事はAIの専門家を対象にし、AIのアーキテクチャー、トレーニング、そして応用に焦点を当てて検討します
Graph RAG LLMによるナレッジグラフのパワーを解き放つ
この記事では、Graph RAGとは何か、そしてLLMsと組み合わせてどのように知識グラフを強化し、より包括的な文脈理解を提供するかが紹介されています
「音で見る:GPT-4V(イジョン)とテキスト読み上げ技術による視覚障がい者のサポート」
視覚障害者のナビゲーションを強化する:GPT-4V(ision)とTTSを統合した高度な感覚支援
「MM-VID for GPT-4V(ision)による進化するAIビデオ理解の解放」
世界中で、個人は毎日さまざまなビデオを作成しています。ユーザー生成のライブストリーム、ビデオゲームのライブストリーム、ショートクリップ、映画、スポーツの放送、広告などです。多目的VoAGIとして、ビデオはテキスト、ビジュアル、オーディオなどさまざまな形態で情報とコンテンツを伝えます。これら多様な形態から学習できる方法を開発することは、手作業でキュレーションされたデータセットの制約を超えて、非キュレーションのリアルワールドのビデオを分析する能力が向上した認知的なマシンの設計にとって重要です。 ただし、この表現の豊かさは、長時間のビデオに取り組む際に特にビデオの理解を探求する際にさまざまな課題をもたらします。特に1時間を超えるビデオの微妙さを把握するには、複数のエピソードをまたぐイメージとオーディオシーケンスの分析方法が必要です。この複雑さは、異なる情報源から情報を抽出し、スピーカーを識別し、キャラクターを識別し、物語の一貫性を維持する必要性とともに増加します。さらに、ビデオの証拠に基づいて質問に答えるには、コンテンツ、文脈、字幕の深い理解が求められます。 ライブストリーミングやゲームのビデオでは、リアルタイムでの動的な環境の処理において追加の課題が生じます。セマンティックな理解と長期的な戦略的計画への関与が必要です。 近年、大規模な事前トレーニング済みのビデオ-言語モデルにおいて大きな進展が達成され、ビデオコンテンツに対する優れた推論能力が示されています。しかし、これらのモデルは通常、短いクリップ(例:10秒のビデオ)や事前定義されたアクションクラスでトレーニングされています。そのため、これらのモデルは複雑なリアルワールドのビデオの微妙な理解を提供することに制約が生じる場合があります。 リアルワールドのビデオの理解の複雑さには、シーン内の個人の特定とその行動の明確化が含まれます。さらに、これらの行動の時期や方法を特定する必要があります。また、さまざまなシーンで微妙なニュアンスやビジュアルの手がかりを認識する必要があります。この研究の主たる目的は、これらの課題に取り組み、リアルワールドのビデオ理解に直接適用可能な手法を探求することです。アプローチは、延長ビデオコンテンツを一貫したストーリーに分解し、これらの生成されたストーリーをビデオ分析に使用することを含みます。 大規模なマルチモーダルモデル(LMM)の最近の進展、GPT-4V(ision)などの進歩により、入力画像とテキストの両方の処理において優れた理解能力が示されました。これにより、LMMの応用範囲をビデオドメインに拡大することに関心が集まっています。本記事で報告された研究では、ビデオ理解のために専門ツールをGPT-4Vと統合するシステムであるMM-VIDを紹介しています。システムの概要は以下の図に示されています。 入力ビデオを受け取ると、MM-VIDはマルチモーダルの前処理を開始し、シーン検出と自動音声認識(ASR)を含めてビデオから重要な情報を収集します。その後、シーン検出アルゴリズムに基づいて入力ビデオを複数のクリップに分割します。次に、GPT-4Vを使用し、クリップレベルのビデオフレームを入力として、各ビデオクリップの詳細な説明を生成します。最後に、GPT-4Vは、クリップレベルのビデオの説明、ASR、および利用可能なビデオのメタデータに基づいて、全体のビデオに対する一貫したスクリプトを生成します。生成されたスクリプトは、MM-VIDがさまざまなビデオタスクを実行するための力を与えます。 この研究からのいくつかの例を以下に報告します。 これがMM-VIDの概要であり、GPT-4Vと専門ツールを統合した新しいAIシステムです。興味があり、さらに詳しく知りたい場合は、以下に引用されたリンクを参照してください。
ディープマインドのグラフキャストに会いましょう:機械学習による天気予報の飛躍
天気予報技術の重要な進展として、Google DeepMindは画期的な機械学習モデルである「GraphCast」を紹介しました。このAIツールは、従来の数値天気予報(NWP)モデルの支配に挑戦し、より正確かつ迅速な予測を提供するという大幅な飛躍を示しています。 天気予報の革新 GraphCastはデスクトップコンピュータで効率的に動作し、エネルギーとコストがかかる大型コンピュータに依存するNWPモデルとは対照的です。このAIモデルは、科学誌「Science」で11月14日に説明されたもので、過去と現在の天気データを利用して将来の天気予測を迅速に行います。 この革新は、気候変動や極端な気象イベントによる世界的な課題が生じている現在、正確な天気予測がますます重要になっているタイミングで登場しました。従来のNWPモデルは正確ですが、大気中の熱、空気、水蒸気の移動をマッピングするために広範な計算リソースを必要とします。 GraphCastの伝統的なモデルに対する優位性 DeepMindのロンドンの研究所で開発されたGraphCastは、1979年から2017年までの過去の世界の気象データを使用してトレーニングされました。気温、湿度、気圧、風などのさまざまな天気要素の間の相関関係を理解するために、この広範なデータセットを利用します。GraphCastの予測能力は最大で10日先までで、RESolution予測システム(HRES)のようなECMWFのNWPでは数時間かかるプロセスを1分未満で提供します。 特に、地球の表面に最も近い大気層である対流圏では、12,000の測定のうち99%以上でGraphCastはHRESを上回っています。また、地球の近くの5つの気象変数やより高い高度での6つの大気変数の予測にも精度があります。これには、熱帯低気圧や極端な温度変動を含む激しい天候現象の予測も含まれます。 比較的な優位性 GraphCastの優越性は、従来のモデルに対するだけでなく、他のAI駆動アプローチに対しても目立ちます。以前のHuaweiの研究によると、HuaweiのPangu-weatherモデルと比較した結果、GraphCastは天気予測の99%でより優れたパフォーマンスを示しました。ただし、異なるメトリックスを使用した将来の評価によっては、異なる結果が得られる可能性があることに注意してください。 結論 GraphCastは、計算要件を削減しながら迅速で正確な予測を提供し、天気に依存する活動に関連する気象研究と現実世界の意思決定に大きな支援を約束する、天気予報での変革的な進展を示しています。技術が進化し、現在の制約を克服するにつれて、GraphCastは実用的な応用への統合までに2〜5年かかると予想され、伝統的な手法とAIの革新的な能力を組み合わせた天気予測の新たな時代を切り拓くことになるでしょう。
「最高のデジタルコンテンツ戦略(アレックス・ホルモジとエド・マイレットによるアドバイス)」
最適なコンテンツ戦略を見つけるために、私はサヒル・ブルーム、ダン・コー、アレックス・ホルモジ、ジャスティン・ウェルシュ、そしてエド・マイレットの分析を数ヶ月間にわたって入念に行いました
TSMixer グーグルによる最新の予測モデル
時系列予測の領域は、N-HiTS、PatchTST、TimesNet、そしてもちろんTimeGPTといった多くの重要な最近の貢献により、泡立ちを続けています一方、Transformerは…
「NVIDIA CUDA Quantumによる研究者の進歩が期待される」
マイケル・クーンとダヴィデ・ヴォドラは、世界最大の化学会社のために量子コンピューティングを開拓する取り組みを新たな高みにもっていく。 BASFの研究者たちは、量子アルゴリズムが従来のシミュレーションでは見ることのできない、NTAという化合物の重要な属性を見ることができることを実証している。この化合物には鉄などの有害金属を都市の下水から除去するなどの応用がある。 BASFの量子コンピューティングチームは、GPU上で24キュービットに相当する量子コンピュータの処理エンジンであるもので、この課題に取り組むことができるかどうかをシミュレーションした。 多くの企業の研究開発拠点では、これを重要な達成と見なすだろうが、彼らはさらに進み、最近NVIDIAのEos H100スーパーコンピュータで初めて60キュービットのシミュレーションを実行した。 「これは、量子アルゴリズムを使用して分子の最大シミュレーションです」とクーンは言った。 柔軟で使いやすいソフトウェア BASFは、NVIDIA CUDA QuantumというCPU、GPU、および量子コンピュータのためのプラットフォームでシミュレーションを実行している。これは、QPUsとも呼ばれる。 ヴォドラはこれを「非常に柔軟で使いやすく、比較的シンプルなブロックから複雑な量子回路シミュレーションを構築することができる」と述べた。「CUDA Quantumがなければ、このシミュレーションを実行することは不可能でした」と彼は付け加えた。 この作業には多くの計算能力も必要であり、それでBASFはNVIDIAのH100 Tensor Core GPUを使用したNVIDIA DGX Cloudサービスに頼った。 「私たちは多くの計算能力が必要であり、この種のシミュレーションにはCPUベースのハードウェアよりもNVIDIAプラットフォームの方がはるかに高速です」とクーンは語った。 BASFの量子コンピューティングイニシアティブは、クーンが立ち上げに関与した2017年に始まった。チームは化学の他にも、機械学習、物流、スケジューリングの最適化など、量子コンピューティングの利用事例の開発にも取り組んでいる。 CUDA Quantumコミュニティの拡大 他の研究グループもCUDA Quantumを用いて科学の進歩を遂げている。…
「Pythonによるロジスティック回帰のエラーのデバッグのベストプラクティス」
「ロジスティック回帰(LR)の基本についてはたくさんのことが書かれてきましたその多機能性や実績のあるパフォーマンス、基礎となる数学についてもしかし、LRを成功裏に実装し、デバッグする方法を知ることが重要です...」
Find the right Blockchain Investment for you
Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.