DeepMindの最新の研究(ICML 2022)

DeepMind's latest research (ICML 2022).

より効果的かつ効率的なAIにより一般化システムの道を切り拓く

今週末から、第39回国際機械学習会議(ICML 2022)が2022年7月17日から23日までアメリカ合衆国メリーランド州ボルチモアコンベンションセンターでハイブリッドイベントとして開催されます。

人工知能、データサイエンス、マシンビジョン、計算生物学、音声認識など、さまざまな分野で活躍する研究者たちは、機械学習の最先端の研究成果を発表し、公開しています。

私たちの研究チームは、会議のスポンサーとしてだけでなく、長年のパートナーであるLatinX、Black in AI、Queer in AI、Women in Machine Learningが主催するワークショップやソーシャルイベントをサポートしています。また、私たちの研究チームは、17の外部共同研究を含む30本の論文を発表しています。以下に、私たちの口頭発表とスポットライト発表の概要を紹介します。

効果的な強化学習

一般化AIシステムを構築するために、強化学習(RL)アルゴリズムをより効果的にすることが重要です。これには、性能の精度と速度の向上、転移学習とゼロショット学習の改善、計算コストの削減などが含まれます。

私たちの選ばれた口頭発表の一つでは、ポリシーの合成に対して一般化ポリシー改善(GPI)を適用する新しい方法を示し、エージェントのパフォーマンスをさらに向上させることを示しています。また、別の口頭発表では、ボーナスの必要性を排除することなく、効率的に探索するための新しい接地可能かつスケーラブルな方法を提案しています。同時に、強化学習エージェントにメモリベースの検索プロセスを追加する方法を提案し、エージェントのモデル容量への依存を減らし、過去の経験を素早く柔軟に利用することが可能になります。

言語モデルの進歩

言語は人間であるための基本的な要素です。それによって人々は思考や概念の伝達、記憶の作成、相互理解の構築ができます。言語の側面を研究することは、AIシステムや人間の知能がどのように機能するかを理解する上で重要です。

統一されたスケーリング則と検索についての私たちの口頭発表は、より効率的に大規模な言語モデルを構築する方法について探求しています。より効果的な言語モデルの構築方法を見るために、新しいデータセットとStreamingQAによる評価基準を紹介し、モデルが時間とともにどのように知識を順応し、忘れるかを評価しています。また、ナラティブ生成に関する私たちの論文では、現在の事前学習済み言語モデルが短期記憶の制約により長いテキストの生成に苦労していることを示しています。

アルゴリズム的推論

ニューラルアルゴリズム的推論は、アルゴリズム的な計算ができるニューラルネットワークを構築する技術です。この成長分野の研究は、既知のアルゴリズムを現実世界の問題に適用するのに大きな潜在能力を持っています。

私たちはアルゴリズム的推論のためのCLRSベンチマークを紹介し、ニューラルネットワークが「アルゴリズムイントロダクション」の教科書からの30種類の古典的アルゴリズムを実行する能力を評価しています。同様に、数学者が複雑な定理を証明するのに役立つ自動定理証明のために、ヒンサイト経験リプレイを適応させた一般的なインクリメンタル学習アルゴリズムを提案しています。さらに、科学と工学の複雑なシミュレーション問題を解決するための機械学習シミュレーターで伝統的なシミュレーションと数値計算法を使用するフレームワークを提案しています。

私たちのICML 2022での研究全体の範囲はこちらからご覧いただけます。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI研究

この中国のAI研究は、マルチモーダルな大規模言語モデル(MLLMs)の幻覚を修正するために設計された革新的な人工知能フレームワークである「ウッドペッカー」を紹介します

中国の研究者たちは、マルチモーダルな大規模言語モデル(MLLM)における幻覚の問題に対処するために、Woodpeckerという新し...

機械学習

「Transformerモデルの実践的な導入 BERT」

ハンズオンチュートリアルでBERTを探索してください:トランスフォーマーを理解し、プレトレーニングとファインチューニング...

データサイエンス

「オンライン大規模な推薦のためのデュアル拡張二つのタワーモデル」

推薦システムは、ユーザーに個別にカスタマイズされた提案を提供するために設計されたアルゴリズムですこれらのシステムは、...

AI研究

UCバークレーとMeta AIの研究者らは、トラックレット上で3Dポーズとコンテキスト化された外観を融合することにより、ラグランジュアクション認識モデルを提案しています

流体力学では、ラグランジュ流体場形式とオイラー流体場形式を区別することが慣習となっています。Wikipediaによると、「流体...

コンピュータサイエンス

ChatGPT' の邪悪な双子 'WormGPT' が、黙ってメールに侵入し、銀行を襲撃しています

「SlashNextは、WormGPTが言語生成AIモデルの脅威の例であると述べています」