AIを用いて量子スケールで物質をシミュレーションする

Using AI to simulate matter at a quantum scale.

21世紀の主要な課題のいくつか、例えばクリーンな電力の生産や高温超伝導体の開発などを解決するためには、特定の特性を持つ新しい材料を設計する必要があります。コンピュータ上でこれを行うためには、原子が分子を形成する際にどのように結合するかを制御し、固体中での電気の流れも担当する亜原子粒子である電子のシミュレーションが必要です。数十年にわたる努力といくつかの重要な進展にもかかわらず、電子の量子力学的な振る舞いを正確にモデル化することは未解決の課題のままです。そして、Science誌に掲載されたオープンアクセスのPDFの論文において、私たちは化学の大部分で最先端の精度を達成するニューラルネットワークであるDM21を提案しています。科学の進歩を加速するために、私たちは誰でも利用できるように私たちのコードもオープンソース化しています。

ほぼ100年前、エルヴィン・シュレーディンガーは、量子力学的な粒子の振る舞いを制御する有名な方程式を提案しました。この方程式を分子中の電子に適用することは困難であり、すべての電子がお互いを反発するためです。それには各電子の位置の確率を追跡する必要がありますが、それは少数の電子でも非常に複雑なタスクです。一つの大きな進歩は、1960年代にピエール・ホーエンバーグとウォルター・コーンが、個々の電子を追跡する必要はないことを認識したときに訪れました。代わりに、任意の電子が各位置に存在する確率(つまり、電子密度)を知っていれば、すべての相互作用を正確に計算するのに十分です。コーンはこれを証明した後、ノーベル化学賞を受賞し、これにより密度汎関数理論(DFT)が確立しました。

DFTはマッピングが存在することを証明していますが、50年以上にわたって電子密度と相互作用エネルギーのこのマッピングの正確な性質、つまり密度汎関数は未知のままであり、近似しなければなりません。DFTは本質的に近似のレベルを含んでいるにもかかわらず、マイクロレベルで物質の振る舞いがどのようになるか、そしてなぜなるのかを研究するための唯一の実用的な方法であり、そのため科学全般で最も広く使用される技術の一つになっています。これまで、研究者たちは正確な関数に対してさまざまなレベルの精度を持つ多くの近似を提案してきましたが、これらの近似はすべて、正確な関数の重要な数学的性質を捉えることができないため、システマティックなエラーを抱えています。

私たちは、関数をニューラルネットワークとして表現し、これらの正確な性質をトレーニングデータに組み込むことで、重要なシステマティックエラーがない関数を学習し、広範な化学反応のより良い記述を実現しています。

私たちは具体的には、従来の関数に関して2つの長年の問題に取り組んでいます:

  • 分散エラー:DFTの計算では、関数はエネルギーを最小化する電子の配置を見つけることによって分子の電荷密度を決定します。したがって、関数のエラーは計算された電子密度にエラーをもたらす可能性があります。ほとんどの既存の密度汎関数の近似は、1つの分子や原子の周りに正しく局在化される代わりに、不現実的に複数の原子や分子に広がっている電子密度を好む傾向があります(図2を参照)。
  • スピン対称性の破れ:既存の関数では、化学結合の破壊を記述する際に、一般的にスピン対称性として知られる基本的な対称性が破れるような構成を好む傾向があります。対称性は物理学や化学の理解において重要な役割を果たすため、この人工的な対称性の破れは既存の関数の主要な欠陥を明らかにします。

原理的には、電荷の移動を伴う化学的・物理的なプロセスは分散エラーの影響を受ける可能性があり、結合の破壊を伴うプロセスはスピン対称性の破れの影響を受ける可能性があります。電荷の移動と結合の破壊は、多くの重要な技術的な応用において核心的な要素ですが、これらの問題は水素などの最も単純な分子を記述するための関数の質的な不具合をもたらすこともあります。DFTは非常に重要な技術であるため、これらの関数が複雑な分子間相互作用の説明を求められる前に、この単純な化学を正確に記述する関数を設計することが重要です。

Fig 2 | 左: 伝統的な関数(B3LYP)は、電荷が隣接する2つの分子に広がると予測しています。右: 学習された関数(DM21)は、電荷を1つの分子に正しく局在化しています。

これらの長年の課題は、機能が「分数の電子特性」を持つシステムに対してどのように振る舞うかに関連しています。ニューラルネットワークを使用して機能を表現し、トレーニングデータセットを調整して正確な機能に期待される分数の電子挙動を捉えることにより、局在化とスピン対称性の破れの問題を解決できることがわかりました。また、私たちの機能は広範な大規模ベンチマークで非常に正確であることも示しており、これまでに手に入れることのできなかった正確な機能の側面を捉えるためにデータ駆動アプローチを使うことができる可能性があります。

長年にわたり、コンピュータシミュレーションは現代のエンジニアリングにおいて中心的な役割を果たしてきました。これにより、「この橋は持ちこたえるか?」から「このロケットは宇宙に到達するか?」などの信頼性のある答えを提供することが可能になりました。技術が量子スケールに向かって進化し、材料、医薬品、触媒などに関する、私たちが見たことも想像したこともない問題を探求する中で、深層学習はこの量子力学レベルで物質を正確にシミュレートする可能性を示しています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

スマートインフラストラクチャのリスク評価における人間とAI・MLの協力

「人間の専門知識、AIの洞察、およびMLアルゴリズムをシナジー効果を発揮させることで、より安全で適応性のある都市システム...

データサイエンス

「機械エンジニアからデータサイエンティストへの転職方法」

データサイエンスは世界を変革し、問題解決のアプローチ方法を変えました。データプロフェッショナルへの高い需要、高収入、...

人工知能

LLMツールはソフトウェアの脆弱性を発見し、修復します

ソフトウェア会社Vicariusは、先月のBlack Hat USAカンファレンスで、ソフトウェアの脆弱性を自動的に特定および修復する生成...

機械学習

「DAE Talking 高忠実度音声駆動の話し相手生成における拡散オートエンコーダー」

今日は、新しい論文と、私が出会った中で最高品質の音声駆動ディープフェイクモデルについて話し合いますマイクロソフトリサ...

データサイエンス

5分であなたのStreamlitウェブアプリをデプロイしましょう

データサイエンティストが自分の作業をダッシュボードや動作するウェブアプリで紹介することが求められるようになりましたウ...

データサイエンス

価値あるデータテストの作成方法

データの品質については、過去の1年間で広く議論されてきましたデータ契約、データ製品、データ監視ツールの採用が増えている...