「HITL-TAMPを紹介します:自動計画と人間の制御のハイブリッド戦略を通じて、ロボットに複雑な操作スキルを教えるための新しいAIアプローチ」

『ロボットへの複雑な操作スキルの新しいAIアプローチ:HITL-TAMPの紹介』

ロボットに複雑な操作スキルを教えるための人間のデモンストレーションの観察は、有望な結果を示しています。操作のデモを提供することは時間がかかり、労力もかかるため、これを現実世界の長期運用に拡大することは困難です。ただし、タスクのすべての要素が同じではありません。

NVIDIAとジョージア工科大学による新しい研究では、様々な将来の結果が可能な問題を解決するのに特に効果的なTask and Motion Planning(TAMP)システムの強化方法を探索しています。有限の基本的な能力のすべての組み合わせを探索することで、TAMPアプローチはさまざまな多段階の操作タスクの行動を計画することができます。各スキルは従来から手作業で設計されていますが、バネで固定された蓋を閉める、または穴に棒を挿入するなどのタスクは非常に効率的にモデル化するのが非常に難しい例です。代わりに、チームは人間の遠隔操作とクローズドループ学習を利用して、必要な能力のみを組み込み、残りは自動化に任せることでタスクを実現します。これらの機能は、データ収集時の人間の遠隔操作および収集されたデータから学習されたポリシーに依存しています。TAMPシステムと人間の遠隔操作を統合する際には、重要な技術的な障壁があり、それらの間でスムーズな引継ぎが確保される必要があります。

これらの障壁を克服するために、彼らはHuman-in-the-Loop Task and Motion Planning(HITL-TAMP)を提供しています。これは、TAMPと遠隔操作を補完的に統合するシステムです。デバイスによって使用されるTAMPゲート制御メカニズムにより、TAMPシステムと人間の遠隔操作の切り替えによるデモンストレーションの収集が可能です。重要なことは、TAMPシステムが人間オペレーターに対して作業計画の特定のポイントでのみ参加するよう促すことで、一度に1つのデモンストレーションセッションを非同期に管理することができる点です。この技術は、データ収集のスループットを劇的に向上させます。これにより、必要なときにのみ人間のデモンストレーションを要求することで、長期運用で接触の頻度が高い作業における巨大なデータセットの収集に必要な労力を削減します。TAMPゲートストラテジーを人間のデータを使用してトレーニングするために、彼らは模倣学習フレームワークとデータ収集システムを統合しています。タスクをロボットに教えるために必要なデータ、タスクを教えるのにかかる時間、教えられたポリシーの成功率について、彼らはこれが完全なタスクの人間のデモンストレーションの収集よりも高いパフォーマンスをもたらすことを示しています。

研究者たちは15人の参加者を対象にHITL-TAMPと通常の遠隔操作システムを比較しました。彼らの方法では、ユーザーは同時に3倍以上のデモンストレーションを獲得することができました。非専門の遠隔操作からのわずか10分のデータで、75%以上の成功率を持つエージェントをトレーニングすることができました。HITL-TAMPは、現実世界のコーヒーの淹れ方など、12の接触の多い長期タスクにまたがる2.1Kのデモンストレーションを収集することで、ほぼ完璧なエージェントを頻繁に生成します。

タスクの全体での人間のデモンストレーションの収集とポリシーの学習効率は、TAMPと遠隔操作の組み合わせによってHITL-TAMPで大幅に向上しています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AIニュース

「アジア競技大会、eスポーツがオリンピックの夢に火をつける新たな節目となる」

中国・杭州で開催されるアジア競技大会では、eスポーツプレイヤーが初めてメダルを獲得する機会があります このイベントは9...

AIニュース

「AI自動化と性別格差:AIが女性労働者に与える影響」

人工知能(AI)の進歩により、労働の未来が再構築されつつあります。AIによる自動化による仕事の喪失への恐怖は広まっていま...

データサイエンス

今日、開発者の70%がAIを受け入れています:現在のテックの環境での大型言語モデル、LangChain、およびベクトルデータベースの台頭について探求する

人工知能には無限の可能性があります。それは、新しいリリースや開発によって明らかになっています。OpenAIが開発した最新の...

データサイエンス

「3つの質問:ロボットの認識とマッピングの研磨」

MIT LIDSのLuca CarloneさんとJonathan Howさんは、将来のロボットが環境をどのように知覚し、相互作用するかについて議論し...

AI研究

UC San Diegoの研究者たちは、EUGENeという使いやすいディープラーニングゲノミクスソフトウェアを紹介します

ディープラーニングは生活のあらゆる分野で使用されています。あらゆる領域でその有用性があります。バイオメディカル研究に...

機械学習

「ディープラーニングモデルのレイヤーを凍結する方法 - 正しいやり方」

「モデルの微調整を行いたい場合や、処理する例に応じて一部のパラメータを固定することは、しばしば有用です以下の例で示さ...