MITとUC Berkeleyの研究者は、最小限の努力で人間がロボットに望むことを素早く教えることができるフレームワークを提案しました
MITとUC Berkeleyの研究者は、ロボットに人間の要望を素早く教えるフレームワークを提案しました
ニューヨーク大学とカリフォルニア大学バークレー校との共同研究により、MITの研究者たちは、人間が最小限の努力で家庭のタスクをロボットに効果的に教えることができる画期的なフレームワークを開発しました。この革新的な手法により、ロボットの適応性が大幅に向上し、高齢者や障害を持つ個人がさまざまな環境で支援を受けるための能力が向上する可能性があります。
ロボットが直面する主な課題は、訓練中に遭遇していない予期しないシナリオやオブジェクトを処理する能力の限定です。その結果、ロボットはしばしば見慣れないアイテムを認識し、タスクを実行することができません。現在のトレーニング手法では、ロボットが失敗する理由がわからないため、再トレーニングプロセスが時間のかかるものとなっています。
MITの研究者は、失敗の原因を特定しフィードバックを提供するメカニズムの欠如が学習プロセスを妨げると説明しています。この問題に対処するため、研究者たちは、ロボットがタスクを完了できない場合に対立的な説明を生成するアルゴリズムベースのフレームワークを開発しました。これらの説明は、成功するために必要な変更に関する洞察を提供します。
- スタンフォード大学とMilaの研究者は、多くの大規模言語モデルの中核構築ブロックの代替として、注目しないHyenaを提案しています
- 研究者たちは、画期的な自己感知人工筋肉を開発しました
- チューリッヒ大学の研究者たちは、スイスの4つの公用語向けの多言語言語モデルであるSwissBERTを開発しました
失敗に直面した場合、システムはロボットがタスクを成功させるためにどのような変更が必要であったかを示す一連の対立的な説明を生成します。その後、ユーザーはこれらの対立的な説明を提示され、失敗に関するフィードバックを提供するよう求められます。このフィードバックは、生成された説明と組み合わせて、ロボットのパフォーマンスを微調整するための新しいデータの作成に使用されます。
微調整とは、既に一つのタスクに対してトレーニングされた機械学習モデルを効率的に同様でありながら異なるタスクを実行できるように調整することです。このアプローチにより、従来の方法と比較して、研究者たちはロボットをより効率的かつ効果的にトレーニングすることができ、ユーザーの要求する時間を短縮することができました。
特定のタスクに対してロボットを再トレーニングする一般的な方法の一つは、ユーザーが望ましいアクションをデモンストレーションする模倣学習です。しかし、この従来の方法では、ロボットが特定の色とマグカップを関連付けるなど、限定的な理解を持つ可能性があります。研究者たちは、マグカップがどの色であってもマグカップであることをロボットに認識させることは煩雑で、多くのデモンストレーションが必要とされると説明しています。
この制約を克服するために、研究者たちのシステムは、ユーザーがロボットが対話するために望んでいる特定のオブジェクトを識別し、タスクに対して重要でない視覚的な要素を決定します。そして、これらの「重要ではない」視覚的な要素をデータオーグメンテーションというプロセスを用いて変更することで、合成データを生成します。
このフレームワークは、以下の3つのステップで進行します:
- ロボットの失敗につながったタスクを提示する。
- ユーザーからデモンストレーションを収集し、望ましいアクションを理解する。
- ロボットの成功を可能にするための可能な変更を探索して対立的な説明を生成する。
人間のフィードバックを組み込み、多数のオーグメンテーションデモンストレーションを生成することで、システムはロボットの学習プロセスをより効率的に微調整します。
研究者たちは、ユーザーがタスクに影響を与えずに変更できる要素を特定するようヒューマンユーザーに求める実験を実施し、その効果を測定しました。その結果、人間はこのタイプの対立的な推論に優れていることが示され、このステップが人間の推論とロボットの推論を結びつける上で有効であることが強調されました。
研究者たちは、目標オブジェクトへのナビゲーション、ドアの解錠、テーブルトップにオブジェクトを配置するなどのタスクにおいて、彼らの手法が従来の技術を上回り、ロボットがより早く学び、ユーザーのデモンストレーションが少なくて済むようにすることができることをシミュレーションを通じて検証しました。
今後の展望として、研究者たちは自動ロボットに彼らのフレームワークを実装し、生成的な機械学習モデルを使用して新しいデータを作成するために必要な時間を短縮する方法を探求し続けることを目指しています。究極の目標は、ロボットに人間のような抽象的な思考能力を備えさせ、タスクと周囲の環境をより良く理解させることです。
このフレームワークの成功により、高い適応性と柔軟性を持ち、私たちの日常生活にシームレスに統合され、様々な環境で貴重な支援とサポートを提供する高度に適応可能なロボットの登場が可能になる可能性があります。
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- 「MITの研究者が、おそらくほぼ正確な(PAC)プライバシーによる機械学習モデルのプライバシー保護において、ブレークスルーを達成」
- 「SimCLRの最大の問題を修正する〜BYOL論文の解説」
- 「信頼性の高い医療用AIツールの開発」
- ETHチューリッヒとマイクロソフトの研究者らが提案したX-Avatarは、人間の体の姿勢と顔の表情をキャプチャできるアニメーション可能な暗黙の人間アバターモデルです
- GoogleがNotebookLMを導入:あなた専用の仮想研究アシスタント
- DeepMindからの新しいAI研究では、有向グラフに対して二つの方向と構造に敏感な位置符号化を提案しています
- 新たな人工知能の研究が、言語モデルの中でマルチモーダルな連鎖思考推論を提案し、ScienceQAにおいてGPT-3.5を16%上回る結果を示しました(75.17% → 91.68%)