BYOL-Explore ブートストラップ予測による探索

BYOL-Explore 探索のためのブートストラップ予測

BYOL-ExploreエージェントがDM-HARD-8のThow-Acrossレベルを解決する際の第二視点と上方視点。一方、純粋なRLと他の基準の探索方法はThow-Acrossで進展を見せません。

好奇心に基づく探索は、エージェントが環境の理解を向上させるために新しい情報を求める積極的なプロセスです。エージェントが過去のイベントの履歴を元に未来のイベントを予測できるワールドモデルを学習しているとします。好奇心に基づくエージェントは、ワールドモデルの予測の不一致を内在的な報酬として使用し、新しい情報を求めるための探索方針を指示することができます。この新しい情報を使用して、ワールドモデル自体を向上させ、より良い予測を行うことができます。この反復プロセスにより、エージェントは最終的に世界のあらゆる新奇さを探索し、この情報を使用して正確なワールドモデルを構築することができます。

コンピュータビジョン、グラフ表現学習、RLでの表現学習に適用されてきたBootstrap Your Own Latent(BYOL)の成功に触発されて、私たちはBYOL-Exploreを提案します。BYOL-Exploreは、困難な探索タスクを解決するための概念的にシンプルで汎用性のある好奇心に基づくAIエージェントです。BYOL-Exploreは、自分自身の将来の表現を予測することによって世界の表現を学習します。それから、表現レベルでの予測エラーを内在的な報酬として使用して好奇心に基づくポリシーを訓練します。したがって、BYOL-Exploreは、表現レベルでの予測エラーを最適化することで、世界の表現、世界のダイナミクス、好奇心に基づく探索ポリシーをすべて一緒に学習します。

BYOL-Explore、Random Network Distillation(RND)、Intrinsic Curiosity Module(ICM)、純粋なRL(内在的報酬なし)の平均キャップされた人間正規化スコア(CHNS)の比較。

設計のシンプルさにもかかわらず、DM-HARD-8のスイートに適用すると、BYOL-Exploreはランダムネットワーク蒸留(RND)やIntrinsic Curiosity Module(ICM)などの標準の好奇心に基づく探索手法を上回ります。すべてのタスクで測定された平均キャップされた人間正規化スコア(CHNS)の観点からの性能です。驚くべきことに、BYOL-Exploreは、すべてのタスクで同時に訓練される単一のネットワークのみを使用してこのパフォーマンスを達成しました。一方、これまでの研究は単一タスクの設定に制限され、人間の専門家のデモが提供された場合にのみこれらのタスクで意味のある進展を遂げることができました。

その汎用性の証拠として、BYOL-Exploreは10の最も困難な探索Atariゲームで超人的なパフォーマンスを達成し、Agent57やGo-Exploreなどの他の競合エージェントよりもシンプルな設計です。

BYOL-Explore、Random Network Distillation(RND)、Intrinsic Curiosity Module(ICM)、純粋なRL(内在的報酬なし)の平均キャップされた人間正規化スコア(CHNS)の比較。

今後、BYOL-Exploreを高度に確率的な環境に一般化することができます。これは将来のイベントの軌跡を生成するために使用できる確率的なワールドモデルを学習することによって実現できます。これにより、エージェントは環境の可能な確率性をモデル化し、確率的な罠を回避し、探索の計画を立てることができるかもしれません。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AIテクノロジー

AIの力による医療の革命:患者ケアと診断の革新化

この記事では、医療分野でのAIの将来の方向性とその応用について探求します

データサイエンス

「ディープラーニングの謎を解明する:CIFAR-10データセットを用いたCNNアーキテクチャの秘密の解明」

「人工知能の絶えず進化する世界において、畳み込みニューラルネットワーク(CNN)は革命的なテクノロジーとして登場し、コン...

AIテクノロジー

「AIライティング革命のナビゲーション:ChatGPTの影響についての考察」

ChatGPT デジタル時代における文章作成の変革 今となっては、私はよく問われます「AI Time Journalの記事を書くためにChatGP...

AIテクノロジー

「2024年のトップ5大学の証明書」

「大学の証明書が技術セクターに特化した知識と専門知識の扉を開く方法を探索してください」

コンピュータサイエンス

世界のトップ10量子コンピューティング企業(2024年)

この記事にリストされているトップ10の量子コンピューティング企業は、量子コンピューティングの分野が急速に変化している中...

AIテクノロジー

「ユーザーエクスペリエンスの向上に役立つAIの6つの異なる方法」

ユーザーエクスペリエンス(UX)は成功したデジタルプラットフォームの中心にあります人工知能(AI)の力によって、それは大...