クラウドソーシングされたフィードバックは、ロボットの訓練に役立ちます

クラウドソーシングによるフィードバックは、ロボットの訓練に貢献する

この新しいアプローチにより、非専門家のユーザーが非同期でフィードバックを提供できるため、世界中のユーザーがエージェントの教育に貢献することができます。¶ クレジット: クリスティーン・ダニロフ、MIT/iStock

マサチューセッツ工科大学(MIT)、ハーバード大学、ワシントン大学の研究者が開発した強化学習手法は、非専門家のユーザーからのクラウドソーシングされたフィードバックを使用してロボットを訓練します。

MITのマルセル・トルネは、Human Guided Exploration(HuGE)メソッドについて、「報酬関数は、タスクを完了するためにエージェントに正確に何をすべきかを伝えるのではなく、エージェントをどこを探索すべきかに導く」と述べています。

研究者たちは、プロセスを2つのパートに分けました。一つは常にクラウドソーシングされた人間のフィードバックで更新されるゴール選択アルゴリズムであり、もう一つはゴール選択によって導かれる自己教師ありの人工知能エージェントの探索を可能にする別のアルゴリズムです。

シミュレーションと実世界の両方のテストで、HuGEは他の手法よりも素早く目標を達成することができました。MITニュースからフル記事を表示

要約内容の著作権は、2023 SmithBucklin、アメリカ合衆国、ワシントンD.C.に帰属します

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AIニュース

AIの環境負荷軽減:アプリを持続可能にするための7つの戦略

記事では、AIアプリケーションに関連する炭素排出量を正確に推定する方法について包括的な方法論を探求しています現在の世界...

AIニュース

「Amazon SageMakerを使用して、生成AIを使ってパーソナライズされたアバターを作成する」

生成AIは、エンターテイメント、広告、グラフィックデザインなど、さまざまな産業で創造プロセスを向上させ、加速させるため...

データサイエンス

「Pythonにおけるサンプリング技術と比較の実践」

私は妻と一緒にクリスマスツリーを組み立てていました私たちは地下室に行って、木を持ち上げて階上に運び、下から上に向かっ...

機械学習

「革新的な機械学習モデルにより、脱炭素化触媒の評価時間が数カ月から数ミリ秒に短縮されました」

バイオマスは、植物、木材、農業廃棄物、その他の生物材料などの有機物を指し、再生可能エネルギー源として利用されることが...

コンピュータサイエンス

「あなたの学校の次のセキュリティガードはロボットかもしれません」

いくつかのテクノロジー企業が、アメリカの学校にセキュリティロボットの提供を開始しました