学習されたプラズマ制御を通じて融合科学の加速化
'融合科学の加速化を目指した学習済みプラズマ制御'
深層強化学習を用いたトカマク内の核融合プラズマの制御に成功
地球上できれいで無限のエネルギー源を見つけるために、研究者たちは長い間検討を重ねてきました。宇宙の星々に力を与える反応である核融合は、その一つです。水素を衝突させて融合させることで、海水の主成分である一般的な元素が巨大なエネルギーを放出します。地球上では、科学者たちはこれらの極端な条件を再現するために、磁気コイルに囲まれたドーナツ型の真空であるトカマクを使用して水素のプラズマを保持しています。しかしこれらの装置内のプラズマは本質的に不安定であり、核融合のためにプロセスを維持することは複雑な課題です。たとえば、制御システムはトカマクの多数の磁気コイルを調整し、秒間何千回もその電圧を調整する必要があります。これにより、プラズマが容器の壁に触れないようにし、熱損失や損傷を防ぐことができます。この問題を解決するために、DeepMindは科学の進歩を推進するために、スイス連邦工科大学ローザンヌ校のスイスプラズマセンターと協力し、トカマク内のこれらのコイルを自律的に制御し、プラズマを効果的に保持するための最初の深層強化学習(RL)システムを開発しました。これにより、核融合研究の進展に新たな道を開くことが可能になりました。
本日Nature誌に掲載された論文で、私たちはスイス・ローザンヌのVariable Configuration Tokamak(TCV)でコントローラを構築し、実行することで核融合プラズマを成功裏に制御できることを示しています。深層RLとシミュレーション環境を組み合わせた学習アーキテクチャを使用して、プラズマを安定させるだけでなく、異なる形状に細かく作り上げることができるコントローラを作成しました。この「プラズマ彫刻」は、RLシステムが超高温の物質を成功裏に制御していることを示しており、さらに重要なことに、科学者たちがさまざまな条件下でプラズマの反応を調査することができるため、核融合炉の理解を向上させる役割を果たしています。
「過去2年間、DeepMindはAIの潜在能力を示し、生物学、化学、数学、そして今回は物理学のさまざまな分野において、科学の進歩を加速し、新たな研究の道を開拓してきた。」Demis Hassabis, DeepMindの共同創設者兼CEO
この研究は、機械学習と専門家コミュニティが共同して取り組み、大きな課題に取り組み、科学的な発見を加速する力を持つものです。私たちのチームは、量子化学、純粋数学、材料設計、天気予報など、さまざまな分野にこのアプローチを応用し、基本的な問題を解決し、AIの人類への恩恵を確保するために、精力的に取り組んでいます。
EPFLのVariable Configuration Tokamak(TCV)の外側から見た写真(左、クレジット:SPC/EPFL)と内側から見た写真(右、クレジット:Alain Herzog / EPFL)およびTCVの容器と制御コイルの3Dモデル(中央、クレジット:DeepMindおよびSPC/EPFL)の写真:
データの取得が困難な場合の学習
核融合の研究は、現在、研究者が実験を行う能力に制約があります。世界中には数十のトカマクがありますが、これらは高価な機器であり、需要も高いです。例えば、TCVは一度の実験でプラズマを最大3秒間維持することができ、その後15分間冷却して次の試みに備える必要があります。さらに、複数の研究グループがしばしばトカマクの使用を共有しており、実験に利用できる時間が制限されています。
現在のトカマクへのアクセスの障壁を考慮して、研究者はシミュレータを利用して研究を進めています。たとえば、EPFLのパートナーは、トカマクのダイナミクスをモデル化する強力なシミュレーションツールを開発しています。私たちはこれらを使用して、RLシステムがTCVをシミュレーションで制御することを学習し、その結果を実際のTCVで検証することができました。これにより、望ましい形状にプラズマを効果的に作り上げることができることを示しました。これは、コントローラをトレーニングするためのより安価で便利な方法ですが、多くの障壁を乗り越える必要がありました。たとえば、プラズマシミュレータは遅く、1秒の実時間をシミュレートするために多くの時間を要します。さらに、TCVの状態は日々変化する可能性があり、ハードウェアの現実に適応するために、物理的およびシミュレーション上のアルゴリズムの改善を行う必要がありました。
シンプルさと柔軟性を優先することでの成功
既存のプラズマ制御システムは複雑であり、TCVの19個の磁気コイルごとに個別のコントローラが必要です。各コントローラはアルゴリズムを使用してリアルタイムでプラズマの特性を推定し、磁石の電圧を適切に調整します。対照的に、私たちのアーキテクチャは、センサからの情報を用いて、すべてのコイルを一度に制御するための単一のニューラルネットワークを使用しています。
デモンストレーションとして、我々は最初に単一のコントローラーでプラズマの多くの側面を操作できることを示しました。
上記のビデオでは、システムが制御を開始する瞬間にTCVの上部にあるプラズマを見ることができます。コントローラーはまず要求された形状にプラズマを整形し、その後プラズマを下方に移動させ、壁から切り離し、船の中央に2本の脚で浮かべます。プラズマは静止し、プラズマの特性を測定するために必要な状態に保たれます。最後に、プラズマは船の上部に戻され、安全に破壊されます。
次に、エネルギー生成において有用性が研究されているさまざまなプラズマ形状を作成しました。例えば、「スノーフレーク」と呼ばれる多くの「脚」を持つ形状を作成しました。この形状は、排気エネルギーを船の壁の異なる接触点に広げて冷却コストを削減するのに役立ちます。また、次世代トカマクであるITERの提案に近い形状もデモンストレーションしました。EPFLではITERのプラズマの挙動を予測するための実験を行っていました。また、TCVではこれまでにないことをしました。船の中に2つのプラズマが同時に存在する「ドロップレット」を安定化させました。単一のシステムでこれらすべての異なる状況に対するコントローラーを見つけることができました。私たちは単に要求する目標を変更し、アルゴリズムが適切なコントローラーを自律的に見つけました。
融合エネルギーの未来とその先へ
他の科学分野にAIを適用した場合と同様に、トカマク制御の成功したデモンストレーションは、AIが融合科学の加速と支援における力を示しており、今後ますます洗練されたAIの使用が期待されています。このコントローラーを自律的に作成する能力は、新しい種類のトカマクを設計する際に使用することができます。また、複雑な機械の制御における強化学習の将来にも光を当てています。特に、AIが人間の専門知識を補完するツールとして機能し、難しい現実世界の問題に対する新しい創造的なアプローチを発見するための手段として活用される可能性は非常に興味深いです。私たちは、強化学習が将来の産業および科学の制御アプリケーションにおいて革新的な技術となると予測しており、エネルギー効率から個別の医療まで、さまざまな分野での応用が期待されます。
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles