「RoboPianistに会いましょう:シミュレートされたロボットハンドを使用したピアノマスタリーにおける高次元制御のための新しいベンチマークスイート」
ロボットハンドを使用したピアノマスタリーにおける高次元制御のための新しいベンチマークスイート
制御および強化学習の領域における計測プロセスは非常に困難です。特に、高次元制御に焦点を当てた頑健なベンチマークが不足していました。特に高次元ロボット工学の最も困難な「チャレンジ問題」である「二手(両手)多指制御」をマスターするためのベンチマークが不足していました。同時に、制御と強化学習のベンチマーク化の努力の中で、深さの異なる側面を集約し、探索し始める取り組みもあります。人間の手の器用さを模倣する研究が数十年にわたって行われているにもかかわらず、ロボットの高次元制御は依然として主要な難題です。
UCバークレー、Google、DeepMind、スタンフォード大学、およびサイモンフレーザー大学の研究者グループは、高次元制御のための新しいベンチマークスイート「ROBOPIANIST」を提案しています。彼らの研究では、二手(両手)シミュレートされた人型ロボットハンドが、ミュージカルインストゥルメントデジタルインターフェース(MIDI)トランスクリプションに基づいてさまざまな曲を演奏する課題を与えられています。ロボットハンドは合計で44個のアクチュエータを持ち、各手に22個のアクチュエータがあり、人間の手の僅かに非完全制御の特性を持っています。
曲をうまく演奏するためには、高次元制御ポリシーの多くの特性を示す方法でアクションをシーケンスする能力が必要です。これには以下が含まれます:
- このAI論文では、COLT5という新しいモデルを提案していますこのモデルは、より高品質かつ高速な処理のために条件付き計算を使用する、長距離入力のためのものです
- メタAIは、CM3leonを紹介します:最先端のテキストから画像生成を提供し、比類のない計算効率を実現するマルチモーダルのゲームチェンジャー
- 「DERAに会ってください:対話可能な解決エージェントによる大規模言語モデル補完を強化するためのAIフレームワーク」
- 空間的および時間的な精度。
- 2つの手と10本の指の調整。
- 他のキープレスを容易にするためのキープッシュの戦略的な計画。
オリジナルのROBOPIANIST-repertoire-150ベンチマークには150の曲が含まれており、それぞれが独立した仮想作品として機能しています。研究者は、モデルフリー(RL)およびモデルベース(MPC)の手法による包括的な実験を通じてモデルフリーおよびモデルベースの手法の性能範囲を研究しています。その結果、提案されたポリシーは改善の余地が多いにもかかわらず、強力なパフォーマンスを発揮することができることが示されています。
ポリシーが曲を学ぶ能力は、曲(つまりタスク)を難易度順にソートするために使用することができます。研究者は、このような基準に基づいてタスクをグループ化する能力が、カリキュラムや転移学習など、ロボット学習に関連するさまざまな領域でのさらなる研究を促進する可能性があると考えています。ロボピアニストは、模倣学習、マルチタスク学習、ゼロショット汎化、およびマルチモーダル(音、ビジョン、タッチ)学習など、さまざまな研究アプローチに対する魅力的な機会を提供しています。全体的に、ROBOPIANISTはシンプルな目標、複製しやすい環境、明確な評価基準を示し、将来のさまざまな拡張の可能性に対して開かれています。
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- マルチモーダル言語モデル:人工知能(AI)の未来
- マイクロソフトAIは、高度なマルチモーダルな推論と行動のためにChatGPTとビジョンエキスパートを組み合わせたシステムパラダイム「MM-REACT」を提案しています
- 「自動推論とツールの利用(ART)を紹介します:凍結された大規模言語モデル(LLM)を使用して、推論プログラムの中間段階を迅速に生成するフレームワーク」
- Concrete MLと出会ってください:プライバシーの保護と安全な機械学習を可能にするオープンソースのFHEベースのツールキット
- 新たなディープ強化学習(DRL)フレームワークは、シミュレートされた環境で攻撃者に対応し、サイバー攻撃がエスカレートする前に95%をブロックすることができます
- 『AI論文によると、大規模な言語モデルの一般的なパターンマシンとしての異なるレベルの専門知識を説明します』
- 「AIのテスト:ChatGPTと他の大規模言語モデルの偽ニュース検出における詳細な評価」