クラウドソーシングされたフィードバックは、ロボットの訓練に役立ちます

クラウドソーシングによるフィードバックは、ロボットの訓練に貢献する

この新しいアプローチにより、非専門家のユーザーが非同期でフィードバックを提供できるため、世界中のユーザーがエージェントの教育に貢献することができます。¶ クレジット: クリスティーン・ダニロフ、MIT/iStock

マサチューセッツ工科大学(MIT)、ハーバード大学、ワシントン大学の研究者が開発した強化学習手法は、非専門家のユーザーからのクラウドソーシングされたフィードバックを使用してロボットを訓練します。

MITのマルセル・トルネは、Human Guided Exploration(HuGE)メソッドについて、「報酬関数は、タスクを完了するためにエージェントに正確に何をすべきかを伝えるのではなく、エージェントをどこを探索すべきかに導く」と述べています。

研究者たちは、プロセスを2つのパートに分けました。一つは常にクラウドソーシングされた人間のフィードバックで更新されるゴール選択アルゴリズムであり、もう一つはゴール選択によって導かれる自己教師ありの人工知能エージェントの探索を可能にする別のアルゴリズムです。

シミュレーションと実世界の両方のテストで、HuGEは他の手法よりも素早く目標を達成することができました。MITニュースからフル記事を表示

要約内容の著作権は、2023 SmithBucklin、アメリカ合衆国、ワシントンD.C.に帰属します

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI研究

XLang NLP研究所の研究者がLemurを提案:テキストとコードの能力をバランスさせた最先端のオープンプリトレーニング済み大規模言語モデル

言語とテクノロジーの交差点によってますます推進される世界において、多目的かつ強力な言語モデルの需要はかつてなく高まっ...

AI研究

「大規模な言語モデルがコンパイラ最適化のメタAI研究者を驚かせる!」

「これは、LLMの明らかな不備についての論文だと思っていましたが、将来の賢いアイデアの動機づけとなるものとして役立つもの...

機械学習

大規模言語モデル(LLM)とは何ですか?LLMの応用と種類

コンピュータプログラムである大規模言語モデルは、テキストの解析や作成のための新しいオプションをソフトウェアに提供しま...

人工知能

「A.I.ブームで最も不可欠な賞を必死に追い求める」

人工知能製品を動かすために、スタートアップ企業と投資家は、グラフィックス処理ユニット(GPU)として知られる重要なチップ...