クラウドソーシングされたフィードバックは、ロボットの訓練に役立ちます

クラウドソーシングによるフィードバックは、ロボットの訓練に貢献する

この新しいアプローチにより、非専門家のユーザーが非同期でフィードバックを提供できるため、世界中のユーザーがエージェントの教育に貢献することができます。¶ クレジット: クリスティーン・ダニロフ、MIT/iStock

マサチューセッツ工科大学(MIT)、ハーバード大学、ワシントン大学の研究者が開発した強化学習手法は、非専門家のユーザーからのクラウドソーシングされたフィードバックを使用してロボットを訓練します。

MITのマルセル・トルネは、Human Guided Exploration(HuGE)メソッドについて、「報酬関数は、タスクを完了するためにエージェントに正確に何をすべきかを伝えるのではなく、エージェントをどこを探索すべきかに導く」と述べています。

研究者たちは、プロセスを2つのパートに分けました。一つは常にクラウドソーシングされた人間のフィードバックで更新されるゴール選択アルゴリズムであり、もう一つはゴール選択によって導かれる自己教師ありの人工知能エージェントの探索を可能にする別のアルゴリズムです。

シミュレーションと実世界の両方のテストで、HuGEは他の手法よりも素早く目標を達成することができました。MITニュースからフル記事を表示

要約内容の著作権は、2023 SmithBucklin、アメリカ合衆国、ワシントンD.C.に帰属します

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

「チャットモデル対決:GPT-4 vs. GPT-3.5 vs. LLaMA-2によるシミュレートされた討論会-パート1」

最近、MetaがGPT-4と競合するチャットモデルを開発する計画を発表し、AnthropicがClaude2を発売したことにより、どのモデルが...

機械学習

『RAPとLLM Reasonersに会いましょう:LLMsを活用した高度な推論のための類似概念に基づく2つのフレームワーク』

毎日は驚くべき進歩をもたらし、画期的なツールと進展をもたらす大規模言語モデル(LLM)があります。これらのLLMは、テキス...

AI研究

『ChatGPTや他のチャットボットの安全コントロールに研究者が問題点を指摘』

新しい報告書によると、広く使用されているチャットボットのガードレールは回避される可能性があり、技術に対して予測不可能...

AIニュース

サイバー犯罪者がWormGPTを使用してメールセキュリティを侵害

サイバー犯罪の絶え間ない変化は、新たな危険なツールの登場をもたらしました。OpenAIのChatGPTや悪名高いサイバー犯罪ツール...

データサイエンス

「人間の労働が機械学習を可能にする方法」

「私たちは機械学習の進歩に必要不可欠な手作業や人間の労働について十分に話しません事実は、技術と人間の活動の間に作り出...

機械学習

「画像の匿名化はコンピュータビジョンのパフォーマンスにどのような影響を与えるのか? 伝統的な匿名化技術とリアルな匿名化技術の比較」

画像匿名化は、識別可能な特徴をぼかすことにより、個人のプライバシーを保護するために視覚データを変更することを指します...