「LLMsを使用して、ロボットの新しいタスクをコーディングする」

「LLMsを使って、ロボットの新しいタスクをコーディングする方法」

研究者たちは、大規模な言語モデルの基礎とコーディング能力を活用して、豊富なシミュレーション環境と専門家のデモンストレーションを自動的に生成するために取り組みました。 ¶ クレジット:MITコンピュータサイエンス・人工知能研究所

マサチューセッツ工科大学(MIT)の研究者を含むチームが、ロボットのために新しいタスクをコーディングし、それをシミュレートするために大規模な言語モデル(LLMs)を使用するツールを開発しました。

GenSimには、ゴール指向と探索的な設定があります。 ゴール指向モードでは、目的を達成するために必要な各ステップを分解し、探索モードでは新しいタスクを作成します。

どちらのモードでも、LLMがタスクの詳細とシミュレーションに必要なコードを生成し、タスクライブラリを使用してコードを改良する必要があります。

研究者は、10のタスクで事前にトレーニングされたGenSimが独自に100の新しい動作を生成し、類似の手法よりも高い成功率でロボットアームにタスクを実行させることができたと結論付けました。

MITのリルイ・ワンは、「GenSimがシミュレーションと現実世界の両方で動作することを示しました」と述べています。 MITコンピュータサイエンスと人工知能研究所 フル記事を見る

要約著作権 © 2023 SmithBucklin、ワシントンDC、アメリカ

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

NVIDIAのCEO、ヨーロッパの生成AIエグゼクティブが成功の鍵を議論

3つの主要なヨーロッパの生成AIスタートアップが、NVIDIAの創設者兼CEOのジェンソン・ホアンと一緒に新しいコンピューティン...

AIニュース

「AIが秘密のメッセージをミームに隠し込む可能性」

コンピュータ科学者たちは、現実的なテキスト、画像、または音声にメッセージをシームレスに隠すための最初のアルゴリズムを...

機械学習

「シュレディンガー・ブリッジはテキスト・トゥ・スピーチ(TTS)合成において拡散モデルに勝るものになっていますか?」

人工知能の進歩に伴い、自然言語処理、自然言語生成、コンピュータビジョンの分野は、最近大きな人気を得ています。これは、...

機械学習

メトリックは欺くことができますが、目はできません:このAIメソッドは、ビデオフレーム補間のための知覚的な品質メトリックを提案します

ディスプレイ技術の進歩により、私たちの視聴体験はより強烈で楽しいものになりました。4K 60FPSで何かを観ることは、1080P 3...

機械学習

「完璧なコンビ:adidasとCovision MediaがAIとNVIDIA RTXを使用して写真のようなリアルな3Dコンテンツを作成」

物理製品の3Dスキャンを作成するのは時間がかかる場合があります。多くの企業は、フォトグラメトリーベースのアプリやスキャ...

AI研究

アリババの研究者らがQwen-Audioシリーズを発表 ユニバーサルな音声理解能力を備えた大規模な音声言語モデルのセット

アリババグループの研究チームは、さまざまなタスクに対する事前学習済みオーディオモデルの限定的な課題に対処するQwen-Audi...