「ユーレカ!NVIDIAの研究によるロボット学習の新たな進展」

「ユーレカ!NVIDIAの研究によるロボット学習の新たな進展」

ロボットに複雑なスキルを教えることができるNVIDIA Researchによって開発された新しいAIエージェントは、ロボットの手にペン回しのテクニックを迅速に演じることを学習しました。これは人間と同じくらいのスキルです。

上記のビデオで見られる驚くべき手品は、ユーレカによってほぼ30のタスクを学習させることによって達成されました。ユーレカは報酬アルゴリズムを自律的に書き、ボットをトレーニングします。

ユーレカは、引き出しやキャビネットを開ける、ボールを投げてキャッチする、はさみを使うなどのタスクもロボットに教えました。

今日発表されたユーレカの研究には、論文とこのプロジェクトのAIアルゴリズムが含まれており、開発者はNVIDIA Isaac Gymを使用して実験することができます。これは強化学習研究のための物理シミュレーションリファレンスアプリケーションです。アイザックジムは、オープンUSDフレームワークに基づいた3Dツールやアプリケーションを構築するための開発プラットフォームであるNVIDIA Omniverse上に構築されています。ユーレカ自体は、GPT-4大規模言語モデルによって動作します。

「ここ10年で強化学習は素晴らしい成果を上げてきましたが、報酬設計などの課題はまだ存在します。それは試行錯誤のプロセスです。」と、NVIDIAのAI研究の上級ディレクターであるアニマ・アナンドクマールは語りました。彼女はまた、ユーレカの論文の共著者でもあります。「ユーレカは、困難なタスクを解決するために生成的学習と強化学習の手法を統合する新しいアルゴリズムを開発するための第一歩です。」

AIがロボットをトレーニング

論文によると、ユーレカが生成する報酬プログラムは、ロボットの試行錯誤学習において、専門家によって作成されたものよりも80%以上のタスクで優れたパフォーマンスを発揮しています。これにより、ボットの平均パフォーマンスが50%以上向上しています。

ユーレカによって引き出しを開けるように学習されたロボットアーム。

このAIエージェントは、ロボットに強化学習のためのソフトウェアコードを生成するためにGPT-4 LLMと生成的AIを活用しています。具体的なタスクの促しや事前定義された報酬テンプレートは必要ありません。また、開発者のビジョンにより正確に合わせて報酬を修正するための人間のフィードバックをすぐに組み込むことができます。

Isaac GymのGPUアクセラレーションされたシミュレーションを使用することにより、ユーレカは効率的なトレーニングのために大規模な報酬候補の品質を迅速に評価することができます。

ユーレカは、トレーニング結果からキーとなる統計情報の要約を作成し、LLMに報酬関数生成の改善を指示します。このように、AI自体が自己改善しています。ユーレカは、四足歩行、二足歩行、クアッドローター、器用な手、共同作業者のアームなど、あらゆる種類のロボットにあらゆる種類のタスクを実行することを教えてきました。

この研究論文では、20のユーレカによるトレーニングされたタスクについて、ロボットの手が幅広い複雑な操作スキルを示す必要があるオープンソースの手先器用さベンチマークに基づく詳細な評価が提供されています。

NVIDIA Omniverseを使用して生成された視覚化で、9つのIsaac Gym環境の結果が紹介されています。

ユーレカを通じて走りの足技を学ぶヒューマノイドロボット。

「ユーレカは、大規模言語モデルとNVIDIAのGPUアクセラレーションされたシミュレーション技術のユニークな組み合わせです」と、プロジェクトの貢献者のひとりであるNVIDIAのシニアリサーチサイエンティスト、リンシ・”ジム”・ファンは述べています。「ユーレカは、器用なロボットの制御を可能にし、アーティストに物理的にリアルなアニメーションを提供する新しい方法を提供すると考えています。」

これは開発者の心を可能性で踊らせる革新的な仕事であり、Voyagerのような最近のNVIDIA Researchの進歩に加わります。VoyagerはGPT-4を使用して構築されたAIエージェントであり、自律的にMinecraftをプレイすることができます。

NVIDIA Researchは、AI、コンピュータグラフィックス、コンピュータビジョン、自動運転車両、ロボット工学などのトピックに特化した数百人の科学者とエンジニアからなるグローバルなチームで構成されています。

EurekaNVIDIA Researchについて詳しく学びましょう。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

「月光スタジオのAIパワード受付アバター、NANAに会いましょう」

エディター注:この投稿は、当社の週刊「In the NVIDIA Studio」シリーズの一環であり、注目のアーティストを紹介し、クリエ...

機械学習

「Underrepresented Groupsの存在下での学習について」

「ICML 2023で受け入れられた最新の成果をご紹介いたします『Change is Hard A Closer Look at Subpopulation Shift』という...

機械学習

「InstaFlowをご紹介します:オープンソースのStableDiffusion(SD)から派生した革新的なワンステップ生成型AIモデル」

拡散モデルは、テキストから画像を生成する革命をもたらし、驚くべき品質と創造性を提供しています。しかし、彼らの多段階の...

機械学習

このAIペーパーは動きがあります 「LaMo」ダンスステップとフューショットラーニングでオフライン強化学習に言語モデルがグルーブをきざむ方法

研究者は、オフライン強化学習において、Large Language Models (LLMs)を用いたフレームワークである言語モデルモーションコ...

データサイエンス

「制限されたデータで言語モデルをトレーニングするのはリスキーですか?SILOに会ってください:推論中のリスクとパフォーマンスのトレードオフを管理する新しい言語モデル」

著作権で保護されたコンテンツを頻繁に使用するため、大規模言語モデル(LM)には法的な懸念が提起されています。法的リスク...

データサイエンス

「ChatGPTが連邦取引委員会によって潜在的な被害の調査を受ける」

重要な進展として、連邦取引委員会(FTC)が人工知能(AI)スタートアップ企業であるOpenAIの調査を開始しました。OpenAIはAI...