クラウドソーシングされたフィードバックは、ロボットの訓練に役立ちます
クラウドソーシングによるフィードバックは、ロボットの訓練に貢献する
マサチューセッツ工科大学(MIT)、ハーバード大学、ワシントン大学の研究者が開発した強化学習手法は、非専門家のユーザーからのクラウドソーシングされたフィードバックを使用してロボットを訓練します。
MITのマルセル・トルネは、Human Guided Exploration(HuGE)メソッドについて、「報酬関数は、タスクを完了するためにエージェントに正確に何をすべきかを伝えるのではなく、エージェントをどこを探索すべきかに導く」と述べています。
研究者たちは、プロセスを2つのパートに分けました。一つは常にクラウドソーシングされた人間のフィードバックで更新されるゴール選択アルゴリズムであり、もう一つはゴール選択によって導かれる自己教師ありの人工知能エージェントの探索を可能にする別のアルゴリズムです。
シミュレーションと実世界の両方のテストで、HuGEは他の手法よりも素早く目標を達成することができました。MITニュースからフル記事を表示
- 「デベロッパー用の15以上のAIツール(2023年12月)」
- 「OpenAIがGPT-6およびGPT-7の立ち上げ準備を進める:中国で商標申請」
- 大ニュース:Google、ジェミニAIモデルのローンチを延期
要約内容の著作権は、2023 SmithBucklin、アメリカ合衆国、ワシントンD.C.に帰属します
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- 「LLM応募の準備を始めるための6つの便利なフリーのノートブック」
- 元アップル社員が生成型AIをデスクトップにもたらす方法
- 「Streamlit、OpenAI、およびElasticsearchを使用してインテリジェントなチャットボットを作成する」
- 「単一細胞生物学のAIのフロンティアを探索する:GeneformerやscGPTのようなゼロショット基礎モデルの批判的評価」
- Gスイートの見逃せない5つのGoogle Duet AIの驚異的な機能
- フォートペック族のメンバーとグーグラーが集まり、社会的な利益をもたらす技術について学び、祝福し、支援するために出会います
- ニューヨーク市がAIに照準を合わせる