発達心理学に触発された深層学習モデルによる直感的な物理学の学習

Intuitive physics learning using deep learning models inspired by developmental psychology.

物理世界の理解は、ほとんどの人が自然に行っている重要なスキルです。しかし、これは人工知能にとってまだ課題です。現実世界で安全かつ有用なシステムを展開するためには、これらのモデルが私たちの直感的な物理的感覚を共有することを望みます。しかし、これらのモデルが物理世界を理解する能力をどのように測定するのか、という別の課題があります。つまり、物理世界を理解するとはどういう意味であり、それをどのように定量化することができるのでしょうか。

幸いなことに、発達心理学者たちは数十年にわたり、乳児が物理世界について知っていることを研究してきました。途中で、彼らはぼんやりとした物理的知識の概念を具体的な物理的概念のセットに分割しました。そして、彼らは乳児を対象としたこれらの概念をテストするための「期待違反」(VoE)のパラダイムを開発しました。

本日、私たちの論文がNature Human Behaviorに掲載され、Physical Conceptsデータセットをオープンソース化しました。この合成ビデオデータセットは、VoEパラダイムを使用して以下の5つの物理的概念を評価します:固体性、物体の持続性、連続性、「変化しなさ」、方向性の慣性。

物理的知識のベンチマークを手に入れたことで、物理的世界について学習することができるモデルの構築に取り組みました。再び、私たちは発達心理学者の研究に着想を得ました。研究者たちは、乳児が物理世界について何を知っているかだけでなく、この行動を可能にするメカニズムも提案しました。変動要素があるにもかかわらず、これらの説明では、物理的世界を一連のオブジェクトに分割し、時間経過とともに進化するという概念が中心的な役割を果たしています。

この研究に触発され、私たちはPLATO(Physics Learning through Auto-encoding and Tracking Objects)というシステムを構築しました。PLATOは、世界をオブジェクトのセットとして表現し、そのオブジェクトが過去にどこにあったか、他のオブジェクトとどのように相互作用しているかに基づいて、将来オブジェクトがどこにあるかを予測します。

シンプルな物理的相互作用のビデオを使用してPLATOをトレーニングした後、PLATOは私たちのPhysical Conceptsデータセットのテストに合格しました。さらに、PLATOと同じ大きさ(またはそれ以上)の「フラット」なモデルをトレーニングしましたが、オブジェクトベースの表現を使用しませんでした。これらのモデルをテストしたところ、すべてのテストに合格しなかったことがわかりました。これは、オブジェクトが直感的な物理学の学習に役立つことを示し、発達の文献からの仮説を支持しています。

また、この能力を開発するためにどれだけの経験が必要かを確認したかったです。物理的な知識の証拠は、2か月半の乳児にも示されています。PLATOはどれくらいの経験を積んだのでしょうか?PLATOに使用されるトレーニングデータの量を変えることで、PLATOが28時間の視覚経験で物理的な概念を学ぶことができることがわかりました。私たちのデータセットの限定的で合成的な性質から、乳児が受ける視覚体験の量とPLATOの比較はできません。しかし、この結果は、直感的な物理学は、世界をオブジェクトとして表現するための帰納的なバイアスを持つ支援があれば、比較的少ない経験で学ぶことができることを示唆しています。

最後に、PLATOの汎化能力をテストしたかったです。Physical Conceptsデータセットでは、テストセットのすべてのオブジェクトはトレーニングセットにも存在します。PLATOにこれまで見たことのないオブジェクトでテストを行った場合はどうなるでしょうか?これを行うために、MITの研究者が開発した別の合成データセットの一部を活用しました。このデータセットも物理的な知識を調査していますが、異なるビジュアルの外観とPLATOが以前に見たことのないオブジェクトのセットを持っています。PLATOは、再トレーニングなしで合格しました。これは、完全に新しい刺激に対してテストされているにもかかわらずです。

このデータセットが、研究者にモデルが物理的世界を理解する能力についてより具体的な理解を提供できることを願っています。将来的には、テストされる物理的概念のリストを増やしたり、新しいオブジェクトの形状や現実世界のビデオを含めた、より豊かな視覚刺激を使用して、直感的な物理学のさらなる側面をテストするために拡張することができます。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

「ChatGPT Meme Creator Pluginを使ってミームを作成する(ビジネスを成長させるために)」

この記事では、ChatGPT Meme Creatorプラグインを使用して、実際に面白いミームを作成する方法を詳しく説明します

データサイエンス

『ELS+ Stream Tool』

ELS+は、企業がデータから有益な洞察を抽出し、意思決定を改善し、パフォーマンスを向上させるためのAIパワードアナリティク...

機械学習

AIによる生産性向上 生成AIが様々な産業において効率の新たな時代を開く

2022年11月22日、ほとんど仮想的な瞬間が訪れ、それは地球上のほぼすべての産業の基盤を揺るがしました。 その日、OpenAIは史...

人工知能

「Oktaの顧客アイデンティティで優れたデジタル体験を提供し、新たな価値を開放しましょう」

オクターの顧客アイデンティティへのビジョンは、ユーザーが迅速に革新し、シームレスなスケールを実現し、あらゆるデジタル...

AIニュース

イーロン・マスクのxAI企業は資金に関する憶測に直面しています

最近の出来事で、イーロン・マスクの人工知能ベンチャー、xAIが資金調達活動に関する噂で注目を浴びています。マスクの会社は...

人工知能

「生成AIを通じて脆弱性を明らかにする」

この記事では、コードスキャンについて学び、MuleSoftのAPIでセキュリティに関連するパラメータの露出を報告する方法について...