マイクロソフトAI研究は、分子システムの平衡分布を予測するためにDistributional Graphormer(DiG)という新しいディープラーニングフレームワークを紹介しました

マイクロソフトAI研究は、新しいディープラーニングフレームワークであるDiGを紹介し、平衡分布の予測に使用されます

分子の構造はその性質と機能を決定します。そのため、構造予測は分子科学における重要な問題です。アミノ酸配列からタンパク質の最も確率的な構造を特定するために、AlphaFoldやRoseTTAFoldのような深層学習アプローチのブレークスルー的な精度が分子科学者たちによって絶賛されています。しかし、構造予測はタンパク質の機能の一部のみを提供することができ、この方法は単一のスナップショットのみを提供します。

最近のMicrosoftの研究では、平衡分布に基づくタンパク質の構造予測のための新しい深層学習フレームワークであるDistributional Graphormer(DiG)を提供しています。これにより、この基本的な問題を解決し、分子科学に活力を与えることを目指しています。DiGは、統計力学と熱力学が分子システムを微視的なレベルで制御するため、平衡分布に従って構造のアンサンブルをモデル化する点で大きな進歩です。

DiGは、分子構造を正確に説明できる汎用グラフ変換器であるGraphormerの改良版であり、分布予測への新しいアプローチを提供します。改良版のGraphormerであるDiGは、深層ニューラルネットワークを利用して、基本的な分子記述子から目標分布を直接予測することができるようになりました。

これは、熱力学と最適化の確立された技術である模擬焼きなましの概念に基づいており、近年の人工生成コンテンツ(AIGC)の分野で重要な進展をもたらした拡散モデルの創造をインスピレーションとしています。模擬焼きなましのプロセスをモデリングすることにより、単純な分布が最も確率的な状態に探索し、落ち着くことで、複雑な分布が徐々に洗練されて構築されます。DiGは、この手順をシミュレートする分子システムのための深層学習フレームワークです。AIGCモデルの基礎として、統計力学と熱力学に起源を持つ拡散モデルが頻繁に使用されます。

簡単な分布を複雑な分布に変換するためのGraphormerを使用して、DiGは拡散に基づいています。DiGを訓練するために使用するデータや情報は柔軟です。分子システムのエネルギーベースの確率とDiGによって予測される確率との差を最小化することにより、DiGは分子システムのエネルギー関数を使用して変換を制御することができます。この方法では、DiGに既存の知識を活かすことができます。

チームは、タンパク質、タンパク質-リガンド複合体、触媒-吸着物系など、さまざまな分子系を対象とした分子サンプリングタスクの一連の実験を通じて、DiGの効果と有望さを示しています。その結果、DiGは現実的で多様な分子構造を効率的かつ低コストで生成するだけでなく、統計力学を用いて巨視的な属性を計算するために必要な状態密度の推定値も提供します。

チームは、DiGが微視的な分子を量的に分析し、その巨視的な特徴を予測するための重要な進歩であり、分子科学において多くの魅力的な新しい研究領域への道を開いていると考えています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI研究

イタリアの新しいAI研究は、音楽合成と音源分離の両方が可能な拡散ベースの生成モデルを紹介しています

人間は、音楽の作曲や合成、分析、つまり音源の分離など、複数の音源を同時に処理することができます。つまり、人間の脳は、...

データサイエンス

「ULTRA 知識グラフ推論のための基礎モデル」

「任意のデータセットを解決するための単一の一般的なモデルを訓練することは、特に基盤モデルの時代において、機械学習の研...

データサイエンス

機械学習システムにおけるデータ品質の維持

機械学習(ML)の眩しい世界では、洗練されたアルゴリズム、魅力的な視覚化、印象的な予測を考案する魅力に夢中になることは...

データサイエンス

大規模な言語モデル:DeBERTa — デコーディング強化BERTと解釈された注意力

最近、BERTは多くの自然言語処理の課題で第一のツールとなりました情報の処理と理解、高品質の単語埋め込みの構築能力に優れ...

人工知能

「3億の仕事が本当にAIによる代替でさらされるか失われるのか?」

ゴールドマン・サックスの報告書の著者たちは、AIによる置き換えによって3億人の仕事が影響を受ける可能性があると示唆してい...

データサイエンス

PandasAIの紹介:GenAIを搭載したデータ分析ライブラリ

イントロダクション 最近、ジェネレーティブ人工知能の分野で急速な発展とブレークスルーがあり、データ分野においても大きな...