クラウドソーシングされたフィードバックは、ロボットの訓練に役立ちます

クラウドソーシングによるフィードバックは、ロボットの訓練に貢献する

この新しいアプローチにより、非専門家のユーザーが非同期でフィードバックを提供できるため、世界中のユーザーがエージェントの教育に貢献することができます。¶ クレジット: クリスティーン・ダニロフ、MIT/iStock

マサチューセッツ工科大学(MIT)、ハーバード大学、ワシントン大学の研究者が開発した強化学習手法は、非専門家のユーザーからのクラウドソーシングされたフィードバックを使用してロボットを訓練します。

MITのマルセル・トルネは、Human Guided Exploration(HuGE)メソッドについて、「報酬関数は、タスクを完了するためにエージェントに正確に何をすべきかを伝えるのではなく、エージェントをどこを探索すべきかに導く」と述べています。

研究者たちは、プロセスを2つのパートに分けました。一つは常にクラウドソーシングされた人間のフィードバックで更新されるゴール選択アルゴリズムであり、もう一つはゴール選択によって導かれる自己教師ありの人工知能エージェントの探索を可能にする別のアルゴリズムです。

シミュレーションと実世界の両方のテストで、HuGEは他の手法よりも素早く目標を達成することができました。MITニュースからフル記事を表示

要約内容の著作権は、2023 SmithBucklin、アメリカ合衆国、ワシントンD.C.に帰属します

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI研究

「IBMの「脳のような」AIチップが、環境にやさしく効率的な未来を約束します」

興味深い進展として、テクノロジー巨人IBMが人工知能(AI)の世界を革新するかもしれない「脳のような」チップのプロトタイプ...

機械学習

「生成AIの余波におけるオープンソースAIの戦い」

テックジャイアントやAI実践者がリスクと報酬を考慮しながら、オープンソースAIの議論の進化する性質について学びましょう

AIニュース

「太陽エネルギーが新たな展開を迎える」

「太陽光葉技術を通じた人工光合成の利用に焦点を当てています」

データサイエンス

「プロダクションに適したRAGアプリケーションの12のチューニング戦略ガイド」

「実稼働のための検索増強生成(RAG)アプリケーションのパフォーマンス向上に調整できる戦略とパラメータ」

コンピュータサイエンス

「不確実な世界での自律的なイノベーション」

ジョナサン・ハウ氏と彼のチームは、航空宇宙制御研究所で、自律型車両が衝突せずに動的な環境を航行できるようにするプラン...