UC San Diegoの研究者DYffusion:空間的時間予測のためのダイナミクスに基づく拡散モデル

UC San Diegoの研究者DYffusion:美しさとファッションについてのリッチな知識を持つ

ダイナミックシステムの将来の振る舞いを予測することは、システムの進化を駆動する基礎的なダイナミクスを理解し、将来の状態について正確な予測を行うことを意味します。正確で信頼性のある確率的な予測は、リスク管理、リソース最適化、政策開発、戦略企画において重要です。多くの応用では正確な長期的な確率的予測を生成することは非常に困難です。運用状況で使用される手法は通常、計算を合理的な時間内に完了させるためにスーパーコンピューターを必要とする複雑な数値モデルに依存しており、しばしばグリッドの空間解像度を犠牲にしています。

確率的ダイナミクス予測における興味深いアプローチの一つは、生成モデリングです。特に拡散モデルを使用することで、自然画像や動画の分布を効果的にモデル化することができます。ガウス拡散が一般的な手法であり、ガウスノイズを用いてデータを様々な程度で破壊する「順方向プロセス」を介して、推論時にランダムな入力を系統的に除去して非常にリアルなサンプルを生成します。ただし、高次元の場合、ノイズから実データへのマッピングを学習することは難しく、特にデータが少ない場合に困難です。そのため、拡散モデルの訓練と結論付けには非常に高い計算コストがかかり、数百の拡散段階にわたる逐次的なサンプリング手続きが必要です。

例えば、ノイズ除去拡散確率モデル(DDPM)を使用して32×32の写真を5万枚サンプリングする場合、約20時間かかります。さらに、動画の拡散モデルを使用する技術はあまりありません。動画の拡散モデルはリアルなサンプルを生成することができますが、データの時間的な側面を特に利用して正確な予測を行うことはありません。この研究では、カリフォルニア大学サンディエゴ校の研究者が、ダイナミクスに基づいた拡散モデルを訓練するための多段階確率予測の新しいフレームワークを提案しています。彼らは非ガウス拡散プロセスの可能性を示す最近の発見に基づき、新しい順方向プロセスを提供します。この手続きは時間補間に依存するため、時間条件付きニューラルネットワークを使用しています。

彼らの手法は、物理システムについての仮定を必要とせずに、ダイナミックシステムの時間ステップを拡散プロセスの段階と結びつけることで帰納的なバイアスを課すことです。その結果、拡散モデルの計算量はメモリ使用量、データ効率性、トレーニングに必要な拡散ステップの数に関して削減されます。高次元の空間時間データに対しては、彼らの拡散モデルベースのフレームワーク(DYffusion)が自然な長期的な関係を捉え、正確な確率的アンサンブル予測を生成します。

以下に彼らの貢献の要約を示します:

・拡散モデルの観点から、多次元でデータが少ない複雑な物理システムに対する確率的な空間時系列予測の研究とその適用を行っています。

・マルチステップ予測と長期の展望のために学習時間を短くし、メモリ要件を削減するために時系列帰納バイアスを利用する柔軟なフレームワークであるDYffusionを提供しています。DYffusionは暗黙的なモデルであり、冷却サンプリングはオイラー法の解と解釈することができます。

・また、条件付きビデオ拡散モデルを含む最先端の確率的手法の計算要件と性能を比較する実証的な研究を行い、提案手法の理論的な示唆について探求します。彼らは、従来のガウス拡散に比べて、提案された手法は良い確率的な予測を行い、計算効率を向上させることを発見しました。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI研究

アリババの研究者らがQwen-Audioシリーズを発表 ユニバーサルな音声理解能力を備えた大規模な音声言語モデルのセット

アリババグループの研究チームは、さまざまなタスクに対する事前学習済みオーディオモデルの限定的な課題に対処するQwen-Audi...

AI研究

アムステルダム大学とクアルコムAIの研究者がVeRAを発表:LoRAと比べて訓練可能なパラメーターの数を10倍削減する革新的なファインチューニングAI手法

自然言語処理の応用範囲の拡大に伴い、最小限の計算複雑性とメモリ要件で特定の指示を効果的に理解し行動するモデルへの需要...

データサイエンス

Voxel51 は、コンピュータビジョンデータセット分析のための Python コードを生成するために GPT-3.5 の能力を活用する AI アシスタントである VoxelGPT をオープンソース化しました

データ中心のコンピュータビジョンと機械学習ソフトウェアの有名なイノベーターであるVoxel51は、最近VoxelGPTを立ち上げ、コ...

データサイエンス

「MLを学ぶ勇気:L1とL2の正則化の解明(パート1)」

「機械学習への挑戦へようこそ」へようこそ、ここではL1とL2の正則化について探求を始めますこのシリーズは、複雑な機械学習...

機械学習

「メタに立ち向かい、開発者を強力にサポートするために、アリババがAIモデルをオープンソース化」

重要な進展として、中国の電子商取引巨人であるアリババが、強力な人工知能モデルをサードパーティの開発者に公開することを...

機械学習

「AIはどれくらい環境に優しいのか?人間の作業と人工知能の二酸化炭素排出量を比較する」

近年、人工知能(AI)は驚異的な進展を遂げ、その応用は医療、銀行業、交通、環境保護などさまざまな産業に広がっています。...