このAI論文では、一般的なソース分布とターゲット分布の間の連続時間確率生成モデルの学習のための新しいクラスのシミュレーションフリーな目的を紹介しています

This AI paper introduces a new class of simulation-free objectives for learning continuous-time probabilistic generative models between a general source distribution and a target distribution.

複雑な分布を記述できる効果的な生成モデルの一つに、スコアベースの生成モデル(SBGM)があります。これには拡散モデルも含まれます。ほとんど常にガウス分布が用いられるソース密度の開発は、スコアベースの生成モデルを用いた確率微分方程式(SDE)のシミュレーションによって一般的に行われます。SBGMは、シミュレーションフリーのノイズ除去目標を最適化するためにガウス分布の仮定が必要であり、その経験的な成功にもかかわらず、ガウス分布の仮定が頻繁に崩れる物理的または生物学的システムの時間的発展の場合など、基礎となるダイナミクスを理解するためには制約があります。 

連続的な正規化フロー(CNF)、またはフローベースの生成モデルは、これらの問題を解決するための選択肢として広く使われています。ソース密度は、確定論的な連続時間生成プロセスの仮定に基づいて、普通の微分方程式(ODE)で目標密度に変換されます。以前の研究では、ガウス分布の仮定がされる場合にCNFがSBGMと競合するためのシミュレーションフリーのトレーニング目標が導入され、これらの目標は任意のソース分布の場合にも拡張されました。フローベースのモデルは、トレーニング時にODEの高価な積分を要求する非効率なシミュレーションベースのトレーニング目標によって以前は制約されていました。 

しかし、これらの目標はまだ確率的なダイナミクスを学習する必要があり、これは生成モデリングと実際のシステムのダイナミクスの回復の両方に役立つ可能性があります。シュレディンガーブリッジ問題(SB)は、特定の参照プロセスの下で、ソースとターゲットの確率分布間の最も確からしい発展を考慮します。これは2つの任意の分布間の確率的マッピングの基本的な確率論的定式化です。自然な確率的ダイナミカルシステム、平均場ゲーム、および生成モデリングなど、多くの問題においてSB問題が使用されています。SB問題は通常、特定の状況(ガウス分布など)を除いて、閉形式の解がなく、学習済みの確率過程を複製するための反復的な手法を用いて近似することができます。 

理論的には妥当なアプローチですが、これらの手法には高次元スケーリングしか許容しない数値的および実用的な問題があります。Mila Québec AI Institute、モントリオール大学、マギル大学、トロント大学、Vector Instituteの研究者は、シュレディンガーブリッジ問題に対するシミュレーションフリースコアとフローマッチング(2M)の目標を研究しています。2Mによって、CNFのシミュレーションフリーの目標と拡散モデルのノイズ除去トレーニング目標が同時に一般化され、それぞれ確率的ダイナミクスと任意のソース分布に対して拡張されます。彼らのアプローチでは、シュレディンガーブリッジはSB問題とエントロピック最適輸送(OT)の関係を用いて、ブラウニアンブリッジの集合のマルコビ化として定義されます。 

2Mでは、ソースとターゲットの分布間の静的なエントロピックOTマッピングを利用し、動的SBアプローチではなく、各反復でSDEをシミュレートする必要がある動的SBアプローチの代わりにSinkhorn法や確率的アルゴリズムによって効果的に近似されます。彼らは2Mの有用性を示すために、シミュレートされたデータと実世界のデータセットを使用します。人工データでは、2Mが生成モデリングの評価指標において他の先行研究と比較して優れた性能を発揮し、実際のシュレディンガーブリッジにより正確な近似を見つけることができます。彼らは実際のデータへの応用として、断面測定系列(つまり、対応のない時系列観測)をシュレディンガーブリッジの連続した系列としてモデリングすることを調査します。 

シュレディンガーブリッジを静的または低次元のダイナミック設定で細胞をモデリングするための先行研究はいくつかありましたが、2Mはシミュレーションを必要とせずに数千の遺伝子次元にスケーリングできる最初のアプローチです。彼らはまた、非ユークリッドコストを持つシュレディンガーブリッジの近似の現実世界での最初の使用例の一つである静的な多様体測地線マップを提供し、動的環境での細胞の補間を向上させます。最後に、彼らは静的最適輸送の例とは異なり、細胞のダイナミクスを制御する遺伝子間相互作用ネットワークを直接モデル化および再構築することができることを示します。コードと例はGitHubで利用可能です。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI研究

Salesforce AIは、既存の拡散モデルを与えられた場合に、テキストから画像への拡散生成を行う新しい編集アルゴリズム「EDICT」を開発しました

最近のテクノロジーと人工知能の分野における進歩により、多くのイノベーションが生まれています。超トレンディなChatGPTモデ...

機械学習

AIキャリアのトレンド:人工知能の世界で注目されているものは何ですか?

急速に成長しているAI分野でのキャリアをお探しですか?エキサイティングな機会を提供するAIキャリアのトップ6つを発見してく...

機械学習

「メタに立ち向かい、開発者を強力にサポートするために、アリババがAIモデルをオープンソース化」

重要な進展として、中国の電子商取引巨人であるアリババが、強力な人工知能モデルをサードパーティの開発者に公開することを...

AIテクノロジー

世界のトップ10の生成AI企業

イントロダクション 人工知能(AI)は、ビジネスの働き方を変革する力を持つ強力なテクノロジーです。AIの素晴らしい側面の一...

機械学習

このAI論文は、イメージとテキストのアラインメントモデルにおける詳細なテキストとビジュアルの説明のための高度な技術を紹介しています

“`html 画像テキストの整列モデルは、視覚的コンテンツとテキスト情報の意味のある関連を確立し、イメージキャプショニ...

人工知能

ChatGPTのドロップシッピング用プロンプト

利益を生むeコマースビジネスを開始するには、完全なチームが必要でしたそれがChatGPTが現れるまでのことでした