DeepMindの最新研究(ICLR 2023)

DeepMind's latest research (ICLR 2023).

科学を一般化、拡大、加速するAIモデルに向けた研究

来週、2022年5月1日から5日までルワンダのキガリで第11回国際学習表現学会(ICLR)が開催されます。これはアフリカで開催される初の主要な人工知能(AI)の国際会議であり、パンデミック以来の初めての対面イベントとなります。

世界中の研究者が集まり、AI、統計学、データサイエンスの分野を横断するディープラーニングの最先端の研究成果や、機械ビジョン、ゲーム、ロボット工学などの応用について共有します。私たちはダイヤモンドスポンサーおよびDEIチャンピオンとして、この会議を支援していることを誇りに思っています。

DeepMindのチームは今年、23本の論文を発表します。以下はいくつかのハイライトです。

AGIへの道におけるオープンな課題

最近の進展は、AIのテキストと画像における驚異的な性能を示していますが、ドメインとスケールを横断して一般化するためにはさらなる研究が必要です。これは、人工一般知能(AGI)を私たちの日常生活において革新的なツールとして開発するための重要なステップとなります。

私たちは、モデルが一度に2つの問題を解決することで学習する新しいアプローチを提案します。モデルに問題を同時に2つの視点から見るように訓練することで、類似の問題を解決する必要があるタスクに対する推論方法を学習し、一般化に有益です。また、ニューラルネットワークの一般化能力を、言語のChomsky階層と比較することで探求しました。16の異なるタスクで2200のモデルを厳密にテストすることで、特定のモデルが一般化に苦労していることがわかり、外部メモリでそれらを補完することが性能向上に重要であることを発見しました。

私たちが取り組んでいる別の課題は、報酬が少なく間隔が広い長期のタスクでの専門レベルの進展です。私たちは、モデルが長期の時間軸で人間らしい方法で探索するための新しいアプローチとオープンソースの訓練データセットを開発しました。

革新的なアプローチ

より高度なAIの能力を開発するにつれて、現在の手法が意図通りに現実世界で効率的に機能することを確保する必要があります。たとえば、言語モデルは印象的な回答を生成できるものの、その応答を説明することができないものも多くあります。私たちは、言語モデルを使用して複数段階の推論問題を解決するための方法を紹介します。これにより、人間が理解し、確認できる説明が提供されます。一方で、敵対的攻撃はAIモデルの限界を探る手法であり、誤ったまたは有害な出力を生成させることでモデルを試すものです。敵対的な例に対して訓練を行うことで、モデルは攻撃に対してより堅牢になりますが、通常の入力に対する性能には影響が出ることがあります。アダプターを追加することで、このトレードオフを動的に制御できるモデルを作成できることを示します。

強化学習(RL)は、さまざまな現実世界の課題において成功を収めていますが、RLアルゴリズムは通常、1つのタスクに対してよく機能するように設計されており、新しいタスクに一般化するのに苦労します。私たちは、アルゴリズム蒸留という方法を提案します。これにより、単一のモデルが多様なタスクにおいてRLアルゴリズムの学習履歴を効率的に模倣することで、新しいタスクに一般化することができます。また、RLモデルは試行錯誤によって学習するため、非常にデータ集約的で時間がかかります。私たちのモデルAgent 57が57のAtariゲーム全体で人間レベルのパフォーマンスに達するのに約800億フレームのデータが必要でした。私たちは、200分の1の経験を使用してこのレベルに訓練する新しい方法を共有し、計算コストとエネルギーコストを大幅に削減します。

科学のためのAI

AIは、研究者が複雑なデータを分析し、私たちの周りの世界を理解するための強力なツールです。いくつかの論文では、AIが科学の進歩を加速している様子や、科学がAIを進化させている様子を示しています。

分子の3D構造からその特性を予測することは、薬物探索において重要です。私たちは、分子特性予測において新たな最先端を達成するノイズ除去法を提案し、大規模な事前訓練を可能にし、異なる生物学的データセットに対して一般化することができます。また、原子位置のデータのみを使用してより正確な量子化学計算を行うことができる新しいトランスフォーマーを紹介します。

最後に、FIGnetでは、ティーポットやドーナツなどの複雑な形状の衝突を物理学から着想してモデル化しています。このシミュレーターは、ロボティクス、グラフィックス、機械設計など、さまざまな分野に応用が可能です。

ICLR 2023でのDeepMindの論文リストとイベントのスケジュールをご覧ください。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

「BeLFusionに出会ってください:潜在的拡散を用いた現実的かつ多様な確率的人間の動作予測のための行動的潜在空間アプローチ」

人工知能(AI)が世界を魅了し続ける中で、コンピュータビジョンとAIの交差点において、人間の動き予測(HMP)という注目すべ...

AI研究

AIを使用してAI画像の改ざんを防ぐ

「PhotoGuard」は、MIT CSAILの研究者によって開発されたもので、不正な画像操作を防ぎ、高度な生成モデルの時代において信頼...

機械学習

ビジネスにおけるオープンソースと専有モデルの選択:生成型人工知能の展開において

ジェネレーティブAIへの関心の高まりにより、2023年中頃には約350社の企業がこの分野に参入しました[1]それぞれが基礎モデル...

AIニュース

「マイクロソフト、Windows上でのCortanaの終了を発表」

マイクロソフトは重要な動きとして、WindowsでのCortanaのサポート終了を宣言しました。この発表は、Windows Centralによって...

AIニュース

オープンAIがインドに進出:現地チームの設立

名声高い人工知能(AI)企業OpenAIは、インドで力強い存在を確立するために重要な進展を遂げています。TechCrunchによれば、...

AIニュース

「GPUを使用してAmazon SageMakerのマルチモデルエンドポイントで数千のモデルアンサンブルを展開し、ホスティングコストを最小限に抑えます」

「人工知能(AI)の導入は、さまざまな業界やユースケースで加速しています深層学習(DL)、大規模言語モデル(LLM)、生成型...