クラウドソーシングされたフィードバックは、ロボットの訓練に役立ちます

クラウドソーシングによるフィードバックは、ロボットの訓練に貢献する

この新しいアプローチにより、非専門家のユーザーが非同期でフィードバックを提供できるため、世界中のユーザーがエージェントの教育に貢献することができます。¶ クレジット: クリスティーン・ダニロフ、MIT/iStock

マサチューセッツ工科大学(MIT)、ハーバード大学、ワシントン大学の研究者が開発した強化学習手法は、非専門家のユーザーからのクラウドソーシングされたフィードバックを使用してロボットを訓練します。

MITのマルセル・トルネは、Human Guided Exploration(HuGE)メソッドについて、「報酬関数は、タスクを完了するためにエージェントに正確に何をすべきかを伝えるのではなく、エージェントをどこを探索すべきかに導く」と述べています。

研究者たちは、プロセスを2つのパートに分けました。一つは常にクラウドソーシングされた人間のフィードバックで更新されるゴール選択アルゴリズムであり、もう一つはゴール選択によって導かれる自己教師ありの人工知能エージェントの探索を可能にする別のアルゴリズムです。

シミュレーションと実世界の両方のテストで、HuGEは他の手法よりも素早く目標を達成することができました。MITニュースからフル記事を表示

要約内容の著作権は、2023 SmithBucklin、アメリカ合衆国、ワシントンD.C.に帰属します

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

データサイエンス

「ブラックボックスの解除:ディープニューラルネットワークにおけるデータ処理の理解のための定量的法則」

人工知能の魅力は、特に深層学習の神秘的な領域で長く謎に包まれてきました。これらの複雑なニューラルネットワークは、複雑...

機械学習

「AIの透明性を解き放つ:Anthropicのフィーチャーグルーピングがニューラルネットワークの解釈可能性を向上させる方法」

最近の論文「Towards Monosemanticity: Decomposing Language Models With Dictionary Learning」では、研究者が、特に言語モ...

人工知能

AIブームがシリコンバレーを再び変革の狂乱に陥れている

新しいAIテクノロジー、信奉者、懐疑論者、そして業界を再構築するキャッシュフローと熱狂に巻き込まれたすべての人々へのガイド

AI研究

ボストン大学の研究者たちは、プラチプスファミリーと称されるファインチューニングされたLLMsを公開しました:ベースLLMsの安価で高速かつパワフルな改良を実現するために

大規模言語モデル(LLM)は世界中で大きな注目を浴びています。これらの非常に効果的で効率的なモデルは、人工知能の最新の驚...

機械学習

ピクセルを説明的なラベルに変換する:TensorFlowを使ったマルチクラス画像分類のマスタリング

「今日のビジュアル中心のデジタル環境では、画像を正確に分類できる能力がますます重要になっています医療、eコマース、自動...