「MITの研究者たちは、人工知能(AI)の技術を開発しましたこの技術により、ロボットは手全体を使ってオブジェクトを操作するための複雑な計画を立てることが可能になります」

MIT researchers developed AI technology that allows robots to create complex plans to manipulate objects using their entire hand.

全身操作は人間の強みですが、ロボットの弱点です。ロボットは、箱とキャリアの指、腕、または胴体の各接触点を、別々の接触イベントとして解釈します。このタスクは、数十億もの可能な接触イベントを考慮すると準備が困難になります。今、MITの研究者は、このテクニックを効率化することができます。つまり、接触豊富な操作計画と呼ばれるものです。AIのアプローチであるスムージングを使用して、接触の発生回数からロボットのための良い操作計画を見つけるために必要な判断の数を減らすことができます。

RLの新たな展開は、モデルベースの手法を使用して以前には実現が困難だった接触豊富なダイナミクスの操作で驚異的な結果を示しました。これらの手法は効果的でしたが、なぜ成功したのかはまだわかっていません。全体的な目標は、モデルベースの観点からこれらの要因を把握し、理解することです。これらの理解に基づいて、科学者たちはRLの経験的な成功をモデルの汎用性と効果性と統合しようと取り組んでいます。

接触ダイナミクスのハイブリッド性質は、モデルベースの観点からタッチを介した計画にとって最大の課題です。次に生じるダイナミクスは非スムーズであり、テイラー展開は局所的には有効ではなく、勾配を使用して構築された線形モデルはすぐに崩壊します。反復的な勾配ベースの最適化とサンプリングベースの計画の両方が局所的な距離指標を使用するため、局所モデルの無効性は両方にとって深刻な困難を引き起こします。これらの問題に対応するために、多くの出版物では接触モードをリストアップしたり、例を提供したりすることで考慮に入れる試みがなされています。これらの計画者は、ダイナミックモードについてモデルベースの理解を持っており、現在の接触モードでの連続状態の計画と次のモードの離散的な探索を切り替えることがあり、ここかしこで数モードのシフトを持つ軌跡につながります。

研究者が追加した最初のものは、基本的なシステムに対して2つのスムージング戦略が理論的に等価であることを証明することです。さらに、このフレームワークを使用して、著者たちはリアルタイムでスムージングされたダイナミクスの局所線形モデル(すなわち、勾配)を効率的に計算する方法を示し、2つのスムージングスキームの定性的な特性と経験的なパフォーマンスがさまざまな複雑な例で比較可能であることを示しています。

2つ目の改善点は、接触ダイナミクスの完全なモデルです。特に、凸である暗黙の時間ステップ接触モデルを提案しています。アニテスクによる摩擦接触の緩和により、凸性が生じます。ただし、それは現実的にはいくつかの非物理的な振る舞いをもたらします。凸性は、標準的な線形補完問題(LCP)の形式に比べて、数値的な利点を提供します。

準動的な仮定は、ロボット操作で一般的に使用されるものであり、長期的な予測可能性を可能にします。準動的モデルでは、速度や減衰を表す変数は不要です。なぜなら、各時間ステップで運動エネルギーが失われるからです。彼らは、ドレイクという高度な2次シミュレータ上で、同じ入力経路をシミュレートして実行することによって、準動的接触モデルを検証しテストしています。考慮されるシステムが減衰が大きく摩擦力に支配されている場合、その結果は、モデルが2次ダイナミクスをより適切に近似できる可能性があることを示唆しています。

さらに、接触モデルを柔軟に緩和するために、対数バリア緩和を使用することができます。凸システムの内部点法で一般的なように、この緩和戦略では対数バリア関数が使用され、ハードな接触制約が柔軟に適用されます。さらに、専門家は、RLが確率論的なグローバル最適化を実行することを目指していることが、その経験的な成功の背後にあるもう一つの主要な要素であると考えています。決定論的モデルを使用した非線形動的計画は通常、非凸最適化問題を生成し、多くの局所最小値の品質が決定的となる可能性があります。

最後の貢献は、RRTのグローバル探索能力とスムージングベースの接触モード抽象化の統合です。ローカルのスムージングされたモデルから導かれた新しい距離測度を使用することで、研究者はRRTが接触ダイナミクスによって課せられる制約範囲内を探索することを可能にしました。

全体的な貢献

科学者たちは、直感的なシステムにおけるランダム化された平滑化技術と解析的な平滑化技術の質的および経験的な同等性を決定します。

彼らは、凸性のある微分可能な準動的接触ダイナミクスと関連する解析的な平滑化の形式化が、接触豊かな操作計画に大いに役立つことを示しています。

研究者たちは、サンプリングベースのモーションプランニングと接触モードの平滑化を統合することで、既存のアプローチのスペクトルにおけるギャップを埋めつつ、効果的なグローバルプランニングを実現しています。

研究者たちは、複雑なシステムにおける関数の平滑化の数学的な意味と、その局所的な近似値を計算するためのいくつかの戦略について説明した後、接触について議論しています。彼らの目標は、平滑化技術とそれらの間の関係を統一的に示すことです。

研究者たちは、モデルベースのアプローチの失敗と多くの人間の接触がある経験的な状況での強力な成功の間に顕著な違いがあることに着想を得て、この研究を行いました。彼らは、既存のモデルベースの計画法の落とし穴を特定し、RLがこのようなトラップを軽減することがどのように可能になったのかを理解し、モデルベースの技術でこれらの問題を解決することで、接触豊かな操作の計画に効果的に取り組むことができることを示しました。1分程度のオンライン計画を可能にし、環境とタスクに対して汎用性を持つことで、既存のRLのツールに比べて数時間または数日にわたる重いオフライン計算に依存することなく、強力な代替手段を提供しています。これを実現するために可能にしたいくつかの要素も検討しています。

要するに、彼らは、実証的な文脈でのRLの成功とモデルベースのアプローチの苦戦との間に大きなギャップがあることに気付いた後、この研究を行うことに着想を得ました。彼らは、既存のモデルベースの計画法の落とし穴を特定し、RLがこのような落とし穴を軽減することがどのように可能になったのかを理解し、モデルベースの技術でこれらの問題を解決することで、接触豊かな操作の計画に効果的に取り組むことができることを示しました。1分程度のオンライン計画を可能にし、環境とタスクに対して汎用性を持つことで、既存のRLのツールに比べて数時間または数日にわたる重いオフライン計算に依存することなく、強力な代替手段を提供しています。これを実現するために可能にしたいくつかの要素も検討しています。

モデルベースのアプローチにおいては、明示的にモードを列挙し、評価する必要があるという欠点が最初に特定されましたが、RLの確率的な平滑化によって緩和されました。次に、モデルベースの技術における別の欠点を取り上げました:二次のトランジェントが長期的な戦略に役立たない短視的な線形化を引き起こす可能性があります。彼らはこの欠点に対処するために、凸性のある微分可能な準動的接触(CQDC)モデルを提案しました。彼らは、数多くの理論的な議論と実験を通じて、タッチモデルの有用性を示しました。また、接触ダイナミクスをモデルの構造の評価を先に行うことで、解析的に緩和させることも示しました。彼らは、ランダム化された平滑化に比べて解析的な平滑化の計算上の利点を示す研究も行いました。

結論として、平滑化ベースのモデルベースの戦略は、局所的な軌道最適化と関連付けられていることがわかりました。グローバルな探索を試みるRLベースの技術と比較して、局所的な最小値に対する感受性のために、困難な問題でより成功していません。ただし、接触豊かなシステムにおけるSBMP技術は、接触モードを明示的に考慮に入れることにより、モード列挙の罠を回避しています。この研究は、接触モードに基づいた滑らかな代替モデルの局所的な近似値に基づいてRRTの探索フェーズをガイドすることで、既存のアプローチのギャップを埋めることにより貢献しています。これらの3つの進歩を組み合わせることで、モデルベースとRLベースのアプローチが非常に接触豊かで高次元なシステムに対して効率的なグローバルモーションプランニングを達成することが可能になりました。将来的には、ポリシーの検索を促進したり、リアルタイムのモーションプランニングを行うために、高度に効率化されたプランナーバージョンを使用する予定です。この改良により、ロボットは計画時間の数秒以内に、以前未踏の領域で接触豊かなデザインをオンラインで見つけることができると予想されます。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

マイクロソフトが「オルカ2」をリリース:特製のトレーニング戦略で小さな言語モデルに高度な推論を導入

LLMs(Large Language Models)は、人間の言語に似た言語を理解し生成するために膨大なテキストデータでトレーニングを受けま...

AI研究

「この新しいAI研究は、事前学習されたタンパク質言語モデルを幾何学的深層学習ネットワークに統合することで、タンパク質構造解析を進化させます」

科学的な探求には、魅力的で複雑な構造を持つタンパク質による魅力的で不思議な方法で重要な生物学的プロセスを支配する分子...

機械学習

このAI論文では、大規模言語モデルでの関連しない行動について探求されています:“シミュレートされた株式取引におけるGPT-4の欺瞞的な戦略”

一部の高度なAIシステムが戦略的な欺瞞を行う可能性について懸念が出ています。AIシステムの安全性を評価することに特化したA...

機械学習

このAI論文は、大規模な言語モデルにおける長期的な会話の一貫性を向上させるための再帰的なメモリ生成手法を提案しています

チャットボットや他のオープンドメインのコミュニケーションシステムは、近年の関心と研究の急増を見ています。長期的な議論...

AI研究

ディープラーニングシステムは、外部から材料の内部を探索します

新しい方法では、外部条件に関するデータだけで、内部構造、空洞、亀裂に関する詳細な情報を提供することができます

データサイエンス

「Amazon SageMaker Data WranglerでAWS Lake Formationを使用して細粒度のデータアクセス制御を適用する」

「SageMaker Data Wranglerは、Amazon EMRと組み合わせてLake Formationを利用できるようになり、この細かいデータアクセス制...