混沌からの彫刻芸術:拡散モデル — SMLD

「混沌から生まれる芸術の彫刻:拡散モデル — SMLD」

想像力は現実を創り出します…

安定拡散から生成された画像

前の記事では、拡散モデルの一般的な構造と非常に人気のあるカテゴリであるDenoising Diffusion Probabilistic Models(DDPM)について説明しました。今回は、拡散プロセスを定式化する完全に異なるが同等のアプローチを見てみましょう。このクラスのモデルはSMLDsと呼ばれ、後ほどより明確になるでしょう。

さあ、旅を始めましょう!

導入

これらのモデルの核心には、確率密度p(x)の(シュタイン)スコア関数である∇ₓlogp(x)があります。

この量は、高密度領域内のランダムサンプルx₀からサンプルxₙに向かう方向を提供します。このプロセスに使用されるアルゴリズムは、ランジュバンサンプリングアルゴリズムと呼ばれます。

DDPMが熱力学から影響を受けたように、SMLDsの基本的なアイデアは物理学に遡ることができます。特に、物理学ではランジュバンダイナミクスとして知られるランジュバンサンプリングは、フランスの物理学者ポール・ランジュバンによって開発された分子システムのダイナミクスの数学的モデリング手法です。

しかし話はここまでにして、この美しいアイデアの実際の数学を見てみましょう!

Score Matching via Langevin Dynamics

この拡散モデルのこのカテゴリの理論的な基礎は、「データ分布の勾配を推定することによる生成モデリング」という画期的な論文で確立されました。ランジュバンサンプリングアルゴリズムによれば、以下の反復プロセスを得ます:

ここで:

zₜ∼ N (0, I)ε > 0x₀∼ p(x₀)(事前分布)。

数学では、これはランジュバンマルコフチェインモンテカルロ(MCMC)として知られています。このプロセスにより、確率分布p(x)からスコア関数のみを使用してサンプリングが可能になります

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

もし芸術が私たちの人間性を表現する方法であるなら、人工知能はどこに適合するのでしょうか?

MITのポストドクターであるジヴ・エプスタイン氏(SM '19、PhD '23)は、芸術やその他のメディアを作成するために生成的AIを...

データサイエンス

「Seerの最高データオフィサーであるDr. Serafim Batzoglouによるインタビューシリーズ」

セラフィム・バツォグルはSeerのチーフデータオフィサーですSeerに加わる前は、セラフィムはInsitroのチーフデータオフィサー...

AIテクノロジー

アンソニー・グーネティレケ氏は、Amdocsのグループ社長であり、テクノロジー部門および戦略部門の責任者です- インタビューシリーズ

アンソニー・グーネティレーケは、Amdocsでグループ社長、テクノロジーと戦略担当です彼と企業戦略チームは、会社の戦略を策...

人工知能

「LeanTaaSの創設者兼CEO、モハン・ギリダラダスによるインタビューシリーズ」

モーハン・ギリダラダスは、AIを活用したSaaSベースのキャパシティ管理、スタッフ配置、患者フローのソフトウェアを提供する...

人工知能

「コマンドバーの創設者兼CEO、ジェームズ・エバンスによるインタビューシリーズ」

ジェームズ・エバンズは、CommandBarの創設者兼CEOであり、製品、マーケティング、顧客チームを支援するために設計されたAIパ...

人工知能

「Ami Hever、UVeyeの共同創設者兼CEO - インタビューシリーズ」

עמיר חבר הוא המנכל והמייסד של UVeye, סטארט-אפ ראיה ממוחשבת בלמידה עמוקה, המציבה את התקן הגלובלי לבדיקת רכבים עם זיהוי...