「HITL-TAMPを紹介します:自動計画と人間の制御のハイブリッド戦略を通じて、ロボットに複雑な操作スキルを教えるための新しいAIアプローチ」

『ロボットへの複雑な操作スキルの新しいAIアプローチ:HITL-TAMPの紹介』

ロボットに複雑な操作スキルを教えるための人間のデモンストレーションの観察は、有望な結果を示しています。操作のデモを提供することは時間がかかり、労力もかかるため、これを現実世界の長期運用に拡大することは困難です。ただし、タスクのすべての要素が同じではありません。

NVIDIAとジョージア工科大学による新しい研究では、様々な将来の結果が可能な問題を解決するのに特に効果的なTask and Motion Planning(TAMP)システムの強化方法を探索しています。有限の基本的な能力のすべての組み合わせを探索することで、TAMPアプローチはさまざまな多段階の操作タスクの行動を計画することができます。各スキルは従来から手作業で設計されていますが、バネで固定された蓋を閉める、または穴に棒を挿入するなどのタスクは非常に効率的にモデル化するのが非常に難しい例です。代わりに、チームは人間の遠隔操作とクローズドループ学習を利用して、必要な能力のみを組み込み、残りは自動化に任せることでタスクを実現します。これらの機能は、データ収集時の人間の遠隔操作および収集されたデータから学習されたポリシーに依存しています。TAMPシステムと人間の遠隔操作を統合する際には、重要な技術的な障壁があり、それらの間でスムーズな引継ぎが確保される必要があります。

これらの障壁を克服するために、彼らはHuman-in-the-Loop Task and Motion Planning(HITL-TAMP)を提供しています。これは、TAMPと遠隔操作を補完的に統合するシステムです。デバイスによって使用されるTAMPゲート制御メカニズムにより、TAMPシステムと人間の遠隔操作の切り替えによるデモンストレーションの収集が可能です。重要なことは、TAMPシステムが人間オペレーターに対して作業計画の特定のポイントでのみ参加するよう促すことで、一度に1つのデモンストレーションセッションを非同期に管理することができる点です。この技術は、データ収集のスループットを劇的に向上させます。これにより、必要なときにのみ人間のデモンストレーションを要求することで、長期運用で接触の頻度が高い作業における巨大なデータセットの収集に必要な労力を削減します。TAMPゲートストラテジーを人間のデータを使用してトレーニングするために、彼らは模倣学習フレームワークとデータ収集システムを統合しています。タスクをロボットに教えるために必要なデータ、タスクを教えるのにかかる時間、教えられたポリシーの成功率について、彼らはこれが完全なタスクの人間のデモンストレーションの収集よりも高いパフォーマンスをもたらすことを示しています。

研究者たちは15人の参加者を対象にHITL-TAMPと通常の遠隔操作システムを比較しました。彼らの方法では、ユーザーは同時に3倍以上のデモンストレーションを獲得することができました。非専門の遠隔操作からのわずか10分のデータで、75%以上の成功率を持つエージェントをトレーニングすることができました。HITL-TAMPは、現実世界のコーヒーの淹れ方など、12の接触の多い長期タスクにまたがる2.1Kのデモンストレーションを収集することで、ほぼ完璧なエージェントを頻繁に生成します。

タスクの全体での人間のデモンストレーションの収集とポリシーの学習効率は、TAMPと遠隔操作の組み合わせによってHITL-TAMPで大幅に向上しています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI研究

天候の変化:AI、高速計算がより速く、効率的な予測を提供することを約束します

2050年までに、極端な天候や気候の頻度と厳しさが増すことにより、ミュンヘン再保険会社によれば、年間100万人の命が失われ、...

データサイエンス

制限から自由:MoMAでのマシン幻覚の検証

Refik Anadol Studioのリードデータサイエンティスト、クリスチャン・バークは、MoMAで展示された「Unsupervised」展での仕事...

機械学習

このAI論文は、拡散モデル内のコンセプトニューロンを分析および識別するための、コーンと呼ばれる新しい勾配ベースの手法を提案しています

複雑な脳の構造により、驚くべき認知的および創造的なタスクを実行することができます。研究によると、人間の内側の側頭葉に...

AI研究

スタンフォード大学の研究者がSequenceMatchを紹介:模倣学習損失を用いたLLMsのトレーニング

自己回帰モデルは、変数の現在の値が過去の値に大きく依存するという直感に基づいた統計モデルの一種です。つまり、モデルは...

機械学習

「IoT企業のインテリジェントビデオアナリティクスプラットフォームを搭載したAIがベンガルール空港に到着」

毎年、約3200万人がベンガルール空港、またはBLRを通過し、世界で最も人口の多い国の中で最も忙しい空港の一つです。 このよ...

データサイエンス

Amazon SageMaker Data WranglerのSnowflakeへの直接接続でビジネスインサイトまでの時間を短縮してください

Amazon SageMaker Data Wranglerは、1つのビジュアルインターフェイスで、コードを書くことなく機械学習(ML)ワークフローで...