ロコムジョコに会おう:厳格な評価と比較のために設計された新しい機械学習ベンチマーク

新しい機械学習ベンチマーク「ロコムジョコ」で厳格な評価と比較

Intelligent Autonomous Systems Group、Locomotion Laboratory、German Research Center for AI、Centre for Cognitive Science、およびHessian.AIの研究者によって、疑似学習(IL)の研究を進めるためのベンチマークが紹介されました。このベンチマークは、既存の単純なタスクに重点を置いている限定的な評価手法の制限に対処しており、クワッドラペッド、バイペッド、および筋骨格ヒューマンモデルを含む多様な環境と包括的なデータセットで構成されています。実際のノイズのあるモーションキャプチャデータ、専門家の正確なデータ、およびサブオプティマルなデータを組み込んでおり、さまざまな難易度レベルで評価が可能です。

既存のベンチマークの制限に取り組むため、LocoMuJoCoはクワッドラペッド、バイペッド、および筋骨格ヒューマンモデルなど、多様な環境を提供しています。実際のモーションキャプチャデータ、専門家の正確なデータ、およびサブオプティマルなデータを伴っており、ベンチマークは難易度レベルにわたるILアルゴリズムの包括的な評価を可能にします。本研究では、確率分布と生体力学的原理に基づく指標が必要であることを強調し、効果的な行動品質評価のために求められるものです。

LocoMuJoCoは、所望のIL用にカスタマイズされたPythonベースのベンチマークであり、既存の基準における標準化の問題に取り組むことを目指しています。LocoMuJoCoはGymnasiumとMushroom-RLライブラリと互換性があり、ヒューマノイドとクワッドラペッドのロコモーション、および筋骨格ヒューマンモデル向けの多様なタスクとデータセットを提供します。この指標は、エンボディメントの不一致、専門家の行動を伴う学習、サブオプティマルな専門家の状態や行動の扱いなど、さまざまなILパラダイムをカバーしています。Mushroom-RLを使用して、クラシカルなIRLおよび対抗的なILアプローチ(GAIL、VAIL、GAIfO、IQ-Learn、LS-IQ、SQIL)のベースラインを提供します。

LocoMuJoCoは、包括的なデータセットを伴うクワッドラペッド、バイペッド、および筋骨格ヒューマンモデルなど、多様な環境を特徴とするベンチマークです。さまざまなエンボディメントに対するトレーニングのための動的ランダム化のためのスムーズなインターフェース、手作りの指標、最新のベースラインアルゴリズム、およびさまざまなILパラダイムのサポートが含まれています。このモデルは一般的なRLライブラリとのユーザーフレンドリーなインターフェースで簡単に拡張可能です。

LocoMuJoCoは、多様な環境と包括的なデータセットを提供することで、ロコモーションタスクの模倣学習のための包括的なベンチマークです。手作りの指標、最新のベースラインアルゴリズム、およびさまざまなILパラダイムのサポートにより、ILアルゴリズムの評価と比較が容易になります。この標準はクワッドラペッド、バイペッド、および筋骨格ヒューマンモデルをカバーし、異なるエンボディメントに対する一部観測可能なタスクを提供します。LocoMuJoCoは、難易度レベルにわたる評価を確実に行います。

LocoMuJoCoは、既存の基準の制限に取り組むとともに、ILアルゴリズムの徹底的な評価を容易にすることを目指しています。クワッドラペッド、バイペッド、および筋骨格ヒューマンモデルなど、多様な環境を含んでおり、難易度レベルの異なる包括的なデータセットを提供しています。この標準は簡単に拡張可能で一般的なRLライブラリと互換性があり、確率分布と生体力学的原理に基づく指標の開発に関するさらなる研究の必要性を認識しています。

本研究では、模倣学習のベンチマークにおける課題を特定し、クローンされた行動の品質を効果的に測定することの難しさを強調しています。確率分布と生体力学的原理の間の差異に基づく指標の開発に関するさらなる研究を提唱しており、特にサブオプティマルなデモンストレーションの場合には優先順位付けされた専門家のデータセットの探索の重要性が強調されています。さらに多くの環境とタスクを含むようにベンチマークを拡張し、多様なILアルゴリズムを使用して、汎用的なLocoMuJoCo指標を探索することが奨励されています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

データサイエンス

ユーザーフィードバック - MLモニタリングスタックの欠けている部分

「AIモデルを数ヶ月もかけて実装し、何百万円も投資してみたけれど、誰も使ってくれないことって経験ありますか?採用の課題...

データサイエンス

「埋め込みモデルでコーパス内の意味関係を探索する」

最近、私はいくつかの仲間の学生や学者と話をしてきましたが、彼らは自由形式のテキストの分析に関心を持っていました残念な...

AIニュース

「InstagramがAIによって生成されたコンテンツにラベルを付けるようになりました」

人気のあるソーシャルメディアアプリInstagramは、プラットフォーム上のコンテンツを認識する方法を革新する画期的な機能を開...

データサイエンス

ChatGPTが知能的ですか? 科学的なレビュー

約1年前、OpenAIはChatGPTをリリースし、世界中を席巻しましたChatGPTは、コンピュータとの対話を、従来のより制約の少ない、...

データサイエンス

モデルの解釈のマスタリング:パーシャル依存プロットの包括的な解説

モデルの解釈方法を知っていることは、それが奇妙なことをしていないかを理解するために不可欠ですモデルをよりよく知ってい...

AI研究

この脳AIの研究では、安定した拡散を用いて脳波から画像を再現します

人間の視覚システムと似たように、世界を見て認識する人工システムを構築することは、コンピュータビジョンの重要な目標です...