DeepMindの最新のICLR 2022での研究
DeepMindの最新のICLR 2022の研究
人工知能の汎用性向上に取り組む
今日、国際学習表現会議(ICLR 2022)が開幕し、2022年4月25日から29日までオンラインで開催されます。世界中から集まった参加者たちは、人工知能の最先端の研究成果、データサイエンス、機械ビジョン、ロボティクスなど、表現学習に関連するさまざまな分野での研究成果を共有するために集まっています。
会議の初日には、私たちのAI for ScienceおよびRobust and Verified AIチームのリーダーであるプッシュミート・コーリ氏が講演を行い、AIが遺伝子解析や構造生物学、量子化学、純粋数学など、さまざまな科学的問題の解決にどのように大きな改善をもたらすかについて話します。
私たちの研究チームは、イベントのスポンサーとしてだけでなく、定期的にワークショップも開催しており、今年は29本の論文を発表しています。以下は、口頭発表、スポットライト発表、ポスター発表の一部を紹介します。
学習の最適化
いくつかの重要な論文では、AIシステムの学習プロセスを効率化する方法に焦点を当てています。これには、パフォーマンスの向上、フューショット学習の進展、計算コストを削減するデータ効率の良いシステムの作成などが含まれます。
「Bootstrapped meta-learning」というICLR 2022の優れた論文賞受賞論文では、エージェントが自己学習によって学び方を学ぶことができるアルゴリズムを提案しています。また、チェス、将棋、囲碁などを自己学習でマスターするシステムであるAlphaZeroを、少数のシミュレーションでトレーニングする場合でも改善を続けるための方策改善アルゴリズム、幅広い強化学習エージェントと環境での容量損失のリスクを軽減するレギュラリザー、効率的に注意モデルをトレーニングするための改良されたアーキテクチャなども提案しています。
探索
好奇心は人間の学習の重要な要素であり、知識やスキルを進化させるのに役立ちます。同様に、探索メカニズムによってAIエージェントは既存の知識を超えて未知の領域を発見したり、新しいことを試したりすることができます。
「エージェントはいつ探索すべきか?」という問いに取り組み、「どのような時間スケールで切り替えるべきか」「どの信号が探索期間の長さと頻度を最も適切に決定するか」などを調査しています。また、別の論文では、強化学習における内発的報酬の制約を超えて学習するための「情報利得探索ボーナス」を紹介しています。
ロバストなAI
MLモデルを実世界で展開するためには、トレーニング、テスト、新しいデータセット間での効果が必要です。因果関係のメカニズムを理解することは重要であり、一部のシステムは適応できる一方、他のシステムは新たな課題に対処するのが困難です。
これらのメカニズムに関する研究を拡大し、分布のシフトに対するロバスト性の細かい分析を可能にする実験的なフレームワークを提案しています。ロバスト性は、意図しないものや標的とされたものに対する攻撃から守るのにも役立ちます。画像の修正に関しては、ぼやけ、霧、その他の一般的な問題の影響を減少させるために、画像間モデルのパラメータを理論的に最適化する技術を提案しています。
新興コミュニケーション
ML研究者がエージェントがタスクを達成するためにどのように自己のコミュニケーションを進化させるかを理解するのに役立つだけでなく、AIエージェントは言語行動に関する洞察を提供し、より対話的で有用なAIにつながる可能性があります。
私たちは、Inria、Google Research、Meta AIの研究者と協力して、人間の集団内の多様性がニューラルエージェントのコンピュータシミュレーションにおける矛盾を解決する一助となる言語の形成にどのように関与するかを調査しました。また、AIにおいて言語表現を改善することが新興コミュニケーションの理解に非常に重要であるため、データセットのスケーリング、タスクの複雑さ、人口サイズなどを独立した要素として調査しました。さらに、複数のエージェントが協力して単一の目標を達成するゲームにおける表現力、複雑さ、予測不可能性のトレードオフについても研究しました。
ICLR 2022での私たちの研究全体については、こちらをご覧ください。
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles