発達心理学に触発された深層学習モデルによる直感的な物理学の学習

Intuitive physics learning using deep learning models inspired by developmental psychology.

物理世界の理解は、ほとんどの人が自然に行っている重要なスキルです。しかし、これは人工知能にとってまだ課題です。現実世界で安全かつ有用なシステムを展開するためには、これらのモデルが私たちの直感的な物理的感覚を共有することを望みます。しかし、これらのモデルが物理世界を理解する能力をどのように測定するのか、という別の課題があります。つまり、物理世界を理解するとはどういう意味であり、それをどのように定量化することができるのでしょうか。

幸いなことに、発達心理学者たちは数十年にわたり、乳児が物理世界について知っていることを研究してきました。途中で、彼らはぼんやりとした物理的知識の概念を具体的な物理的概念のセットに分割しました。そして、彼らは乳児を対象としたこれらの概念をテストするための「期待違反」（VoE）のパラダイムを開発しました。

本日、私たちの論文がNature Human Behaviorに掲載され、Physical Conceptsデータセットをオープンソース化しました。この合成ビデオデータセットは、VoEパラダイムを使用して以下の5つの物理的概念を評価します：固体性、物体の持続性、連続性、「変化しなさ」、方向性の慣性。

物理的知識のベンチマークを手に入れたことで、物理的世界について学習することができるモデルの構築に取り組みました。再び、私たちは発達心理学者の研究に着想を得ました。研究者たちは、乳児が物理世界について何を知っているかだけでなく、この行動を可能にするメカニズムも提案しました。変動要素があるにもかかわらず、これらの説明では、物理的世界を一連のオブジェクトに分割し、時間経過とともに進化するという概念が中心的な役割を果たしています。

この研究に触発され、私たちはPLATO（Physics Learning through Auto-encoding and Tracking Objects）というシステムを構築しました。PLATOは、世界をオブジェクトのセットとして表現し、そのオブジェクトが過去にどこにあったか、他のオブジェクトとどのように相互作用しているかに基づいて、将来オブジェクトがどこにあるかを予測します。

シンプルな物理的相互作用のビデオを使用してPLATOをトレーニングした後、PLATOは私たちのPhysical Conceptsデータセットのテストに合格しました。さらに、PLATOと同じ大きさ（またはそれ以上）の「フラット」なモデルをトレーニングしましたが、オブジェクトベースの表現を使用しませんでした。これらのモデルをテストしたところ、すべてのテストに合格しなかったことがわかりました。これは、オブジェクトが直感的な物理学の学習に役立つことを示し、発達の文献からの仮説を支持しています。

また、この能力を開発するためにどれだけの経験が必要かを確認したかったです。物理的な知識の証拠は、2か月半の乳児にも示されています。PLATOはどれくらいの経験を積んだのでしょうか？PLATOに使用されるトレーニングデータの量を変えることで、PLATOが28時間の視覚経験で物理的な概念を学ぶことができることがわかりました。私たちのデータセットの限定的で合成的な性質から、乳児が受ける視覚体験の量とPLATOの比較はできません。しかし、この結果は、直感的な物理学は、世界をオブジェクトとして表現するための帰納的なバイアスを持つ支援があれば、比較的少ない経験で学ぶことができることを示唆しています。

最後に、PLATOの汎化能力をテストしたかったです。Physical Conceptsデータセットでは、テストセットのすべてのオブジェクトはトレーニングセットにも存在します。PLATOにこれまで見たことのないオブジェクトでテストを行った場合はどうなるでしょうか？これを行うために、MITの研究者が開発した別の合成データセットの一部を活用しました。このデータセットも物理的な知識を調査していますが、異なるビジュアルの外観とPLATOが以前に見たことのないオブジェクトのセットを持っています。PLATOは、再トレーニングなしで合格しました。これは、完全に新しい刺激に対してテストされているにもかかわらずです。

このデータセットが、研究者にモデルが物理的世界を理解する能力についてより具体的な理解を提供できることを願っています。将来的には、テストされる物理的概念のリストを増やしたり、新しいオブジェクトの形状や現実世界のビデオを含めた、より豊かな視覚刺激を使用して、直感的な物理学のさらなる側面をテストするために拡張することができます。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Technical blog

Was this article helpful?

93 out of 132 found this helpful

発達心理学に触発された深層学習モデルによる直感的な物理学の学習

Was this article helpful?

YouTubeと協力しています

人間中心のメカニズム設計とデモクラティックAI

機械学習

「ChatGPT Meme Creator Pluginを使ってミームを作成する（ビジネスを成長させるために）」

『ELS+ Stream Tool』

AIによる生産性向上生成AIが様々な産業において効率の新たな時代を開く

「Oktaの顧客アイデンティティで優れたデジタル体験を提供し、新たな価値を開放しましょう」

イーロン・マスクのxAI企業は資金に関する憶測に直面しています

「生成AIを通じて脆弱性を明らかにする」