発達心理学に触発された深層学習モデルによる直感的な物理学の学習

Intuitive physics learning using deep learning models inspired by developmental psychology.

物理世界の理解は、ほとんどの人が自然に行っている重要なスキルです。しかし、これは人工知能にとってまだ課題です。現実世界で安全かつ有用なシステムを展開するためには、これらのモデルが私たちの直感的な物理的感覚を共有することを望みます。しかし、これらのモデルが物理世界を理解する能力をどのように測定するのか、という別の課題があります。つまり、物理世界を理解するとはどういう意味であり、それをどのように定量化することができるのでしょうか。

幸いなことに、発達心理学者たちは数十年にわたり、乳児が物理世界について知っていることを研究してきました。途中で、彼らはぼんやりとした物理的知識の概念を具体的な物理的概念のセットに分割しました。そして、彼らは乳児を対象としたこれらの概念をテストするための「期待違反」(VoE)のパラダイムを開発しました。

本日、私たちの論文がNature Human Behaviorに掲載され、Physical Conceptsデータセットをオープンソース化しました。この合成ビデオデータセットは、VoEパラダイムを使用して以下の5つの物理的概念を評価します:固体性、物体の持続性、連続性、「変化しなさ」、方向性の慣性。

物理的知識のベンチマークを手に入れたことで、物理的世界について学習することができるモデルの構築に取り組みました。再び、私たちは発達心理学者の研究に着想を得ました。研究者たちは、乳児が物理世界について何を知っているかだけでなく、この行動を可能にするメカニズムも提案しました。変動要素があるにもかかわらず、これらの説明では、物理的世界を一連のオブジェクトに分割し、時間経過とともに進化するという概念が中心的な役割を果たしています。

この研究に触発され、私たちはPLATO(Physics Learning through Auto-encoding and Tracking Objects)というシステムを構築しました。PLATOは、世界をオブジェクトのセットとして表現し、そのオブジェクトが過去にどこにあったか、他のオブジェクトとどのように相互作用しているかに基づいて、将来オブジェクトがどこにあるかを予測します。

シンプルな物理的相互作用のビデオを使用してPLATOをトレーニングした後、PLATOは私たちのPhysical Conceptsデータセットのテストに合格しました。さらに、PLATOと同じ大きさ(またはそれ以上)の「フラット」なモデルをトレーニングしましたが、オブジェクトベースの表現を使用しませんでした。これらのモデルをテストしたところ、すべてのテストに合格しなかったことがわかりました。これは、オブジェクトが直感的な物理学の学習に役立つことを示し、発達の文献からの仮説を支持しています。

また、この能力を開発するためにどれだけの経験が必要かを確認したかったです。物理的な知識の証拠は、2か月半の乳児にも示されています。PLATOはどれくらいの経験を積んだのでしょうか?PLATOに使用されるトレーニングデータの量を変えることで、PLATOが28時間の視覚経験で物理的な概念を学ぶことができることがわかりました。私たちのデータセットの限定的で合成的な性質から、乳児が受ける視覚体験の量とPLATOの比較はできません。しかし、この結果は、直感的な物理学は、世界をオブジェクトとして表現するための帰納的なバイアスを持つ支援があれば、比較的少ない経験で学ぶことができることを示唆しています。

最後に、PLATOの汎化能力をテストしたかったです。Physical Conceptsデータセットでは、テストセットのすべてのオブジェクトはトレーニングセットにも存在します。PLATOにこれまで見たことのないオブジェクトでテストを行った場合はどうなるでしょうか?これを行うために、MITの研究者が開発した別の合成データセットの一部を活用しました。このデータセットも物理的な知識を調査していますが、異なるビジュアルの外観とPLATOが以前に見たことのないオブジェクトのセットを持っています。PLATOは、再トレーニングなしで合格しました。これは、完全に新しい刺激に対してテストされているにもかかわらずです。

このデータセットが、研究者にモデルが物理的世界を理解する能力についてより具体的な理解を提供できることを願っています。将来的には、テストされる物理的概念のリストを増やしたり、新しいオブジェクトの形状や現実世界のビデオを含めた、より豊かな視覚刺激を使用して、直感的な物理学のさらなる側面をテストするために拡張することができます。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

「React開発者にとってのAI言語モデルの力包括的なガイド」

このブログでは、AI言語モデルとReactのシナジーについて探求し、このコラボレーションが開発者の能力を向上させる方法を探り...

データサイエンス

「AI言語モデルにおける迅速なエンジニアリングのマスタリング」

これらのモデルに与えられた指示を洗練し最適化することにより、より正確で文脈に即した回答を得ることができます

機械学習

話すロボット:新しいAIモデルは、ビジョンと言語をロボットの動作に翻訳します

Google DeepMindは、ロボット技術の向上のために新しいビジョン・言語・アクションモデルを紹介します

機械学習

ジェンAIの活用:攻撃型AIに対するサイバー強靭性の構築

「創発型人工知能(GenAI)は、セキュリティの風景を革新し、新しい機会と新しい課題を創り出しています」

データサイエンス

埋め込みの類似検索:データ分析の画期的な変革

オラクルは、意味に基づいて文書を取り込み、保存し、取り出すための生成的AI機能を、クラウドデータ分析サービスに追加しました

AI研究

「UCLA研究者がGedankenNetを紹介:物理法則や思考実験から学ぶ自己教示AIモデルが計算機画像処理を進化させる」

深層学習の最近の進展は、計算画像処理、顕微鏡、ホログラフィ関連の分野に大きな影響を与えています。これらの技術は、バイ...