発達心理学に触発された深層学習モデルによる直感的な物理学の学習

Intuitive physics learning using deep learning models inspired by developmental psychology.

物理世界の理解は、ほとんどの人が自然に行っている重要なスキルです。しかし、これは人工知能にとってまだ課題です。現実世界で安全かつ有用なシステムを展開するためには、これらのモデルが私たちの直感的な物理的感覚を共有することを望みます。しかし、これらのモデルが物理世界を理解する能力をどのように測定するのか、という別の課題があります。つまり、物理世界を理解するとはどういう意味であり、それをどのように定量化することができるのでしょうか。

幸いなことに、発達心理学者たちは数十年にわたり、乳児が物理世界について知っていることを研究してきました。途中で、彼らはぼんやりとした物理的知識の概念を具体的な物理的概念のセットに分割しました。そして、彼らは乳児を対象としたこれらの概念をテストするための「期待違反」(VoE)のパラダイムを開発しました。

本日、私たちの論文がNature Human Behaviorに掲載され、Physical Conceptsデータセットをオープンソース化しました。この合成ビデオデータセットは、VoEパラダイムを使用して以下の5つの物理的概念を評価します:固体性、物体の持続性、連続性、「変化しなさ」、方向性の慣性。

物理的知識のベンチマークを手に入れたことで、物理的世界について学習することができるモデルの構築に取り組みました。再び、私たちは発達心理学者の研究に着想を得ました。研究者たちは、乳児が物理世界について何を知っているかだけでなく、この行動を可能にするメカニズムも提案しました。変動要素があるにもかかわらず、これらの説明では、物理的世界を一連のオブジェクトに分割し、時間経過とともに進化するという概念が中心的な役割を果たしています。

この研究に触発され、私たちはPLATO(Physics Learning through Auto-encoding and Tracking Objects)というシステムを構築しました。PLATOは、世界をオブジェクトのセットとして表現し、そのオブジェクトが過去にどこにあったか、他のオブジェクトとどのように相互作用しているかに基づいて、将来オブジェクトがどこにあるかを予測します。

シンプルな物理的相互作用のビデオを使用してPLATOをトレーニングした後、PLATOは私たちのPhysical Conceptsデータセットのテストに合格しました。さらに、PLATOと同じ大きさ(またはそれ以上)の「フラット」なモデルをトレーニングしましたが、オブジェクトベースの表現を使用しませんでした。これらのモデルをテストしたところ、すべてのテストに合格しなかったことがわかりました。これは、オブジェクトが直感的な物理学の学習に役立つことを示し、発達の文献からの仮説を支持しています。

また、この能力を開発するためにどれだけの経験が必要かを確認したかったです。物理的な知識の証拠は、2か月半の乳児にも示されています。PLATOはどれくらいの経験を積んだのでしょうか?PLATOに使用されるトレーニングデータの量を変えることで、PLATOが28時間の視覚経験で物理的な概念を学ぶことができることがわかりました。私たちのデータセットの限定的で合成的な性質から、乳児が受ける視覚体験の量とPLATOの比較はできません。しかし、この結果は、直感的な物理学は、世界をオブジェクトとして表現するための帰納的なバイアスを持つ支援があれば、比較的少ない経験で学ぶことができることを示唆しています。

最後に、PLATOの汎化能力をテストしたかったです。Physical Conceptsデータセットでは、テストセットのすべてのオブジェクトはトレーニングセットにも存在します。PLATOにこれまで見たことのないオブジェクトでテストを行った場合はどうなるでしょうか?これを行うために、MITの研究者が開発した別の合成データセットの一部を活用しました。このデータセットも物理的な知識を調査していますが、異なるビジュアルの外観とPLATOが以前に見たことのないオブジェクトのセットを持っています。PLATOは、再トレーニングなしで合格しました。これは、完全に新しい刺激に対してテストされているにもかかわらずです。

このデータセットが、研究者にモデルが物理的世界を理解する能力についてより具体的な理解を提供できることを願っています。将来的には、テストされる物理的概念のリストを増やしたり、新しいオブジェクトの形状や現実世界のビデオを含めた、より豊かな視覚刺激を使用して、直感的な物理学のさらなる側面をテストするために拡張することができます。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AIニュース

「解説者に続いて、ウィンブルドンでAIがライン審判を置き換える可能性がある」

ウィンブルドンは、豊かな伝統と名声あるテニスの試合で知られており、ゲームを革命化する可能性のある大きな変化を検討して...

機械学習

「機械学習モデルを展開する」とはどういう意味ですか?

データサイエンスは、ますます多くの企業を引き付け続ける有望な分野ですが、産業化プロセスに統合されるのに苦労しています...

AIニュース

「ChatGPTがクラッシュしましたか? OpenAIのAIのダウンタイムと迅速な回復!」

人工知能コミュニティは一時的な挫折に直面しました。OpenAIが開発した人気のあるチャットボット、ChatGPTは「大規模な障害」...

AIニュース

開発者や企業のためのジェミニAPIとさらに新しいAIツール

「ジェミニAPIおよびそれ以外にも4つのAIツール、Imagen 2、MedLM、開発者向けのDuet AI、セキュリティオペレーション向けのD...

データサイエンス

「力強いコネクティビティ:IoTにおけるエッジコンピューティングの復興」

エッジコンピューティングとIoTがリアルタイムの効率化、帯域幅の最適化、およびイノベーションのために結集します課題はまだ...