Learn more about Search Results エージェント - Page 63

好奇心だけで十分なのか? 好奇心による探索からの新たな振る舞いの有用性について

私たちは、単に好奇心を使って環境を探索したり特定のタスクのボーナス報酬として使用するだけでは、この技術の全ポテンシャルを引き出すことはできず、有用なスキルを見逃してしまいます代わりに、私たちは好奇心に基づく学習中に現れる行動を保持することに焦点を当てることを提案しますこれらの自己発見された行動は、関連するタスクを解決するためのエージェントのレパートリーとして有用なスキルを持っていると考えています

ロボット用の物理シミュレータを公開する

歩く時、足が地面に触れます書く時、指がペンに触れます物理的な接触が世界との相互作用を可能にしますしかし、このような普通の出来事でも、接触は驚くほど複雑な現象です2つの物体の界面で微小なスケールで起こる接触は、柔らかい場合もあれば硬い場合もあり、弾力的な場合もあればスポンジ状の場合もあり、滑りやすい場合もあれば粘り気のある場合もあります私たちの指先には4つの異なるタイプの触覚センサーがあるのも不思議ではありませんこの微妙な複雑さが、ロボット研究の重要な要素である物理的接触のシミュレーションを難しい課題にしています

AGIの現実世界の課題

人々が人工汎用知能(AGI)の世界を想像するとき、ロボットよりも社会の難解な問題に対する解決策を提供するものが思い浮かぶことが多いですしかし、私は後者の方が真実により近いと信じていますAIは既に、タンパク質の折りたたみの解決から正確な天候予測まで、基本的な課題に取り組むための大きな飛躍を実現しています科学者たちはAIを利用して、高度に複雑な現実世界の領域の基本原則や法則を推論することが増えており、これらは彼ら自身では決して発見できなかったものですAGI研究の進歩により、社会は気候変動に取り組み管理する能力が大幅に向上するでしょうそれは緊急性だけでなく、その複雑で多面的な性質のためです

マルコフ報酬の表現力について

私たちの主な結果は、報酬が多くのタスクを表現できる一方で、各タスクタイプのインスタンスにはマルコフ報酬関数では捉えられないものが存在することを証明していますその後、私たちは、各タイプのタスクを最適化するための報酬関数を構築するための多項式時間アルゴリズムのセットを提供し、そのような報酬関数が存在しない場合を正しく判断することができます

スケールにおける言語モデリング:Gopher、倫理的考慮事項、および情報の検索

言語とその役割は、人間であることの基本的な要素であり、理解や知性を示すことと促進することにおいて重要ですそれは人々に思考や概念を伝え、アイデアを表現し、記憶を創り、相互理解を築く能力を与えますこれらは社会的知性の基盤的な要素ですDeepMindのチームは、言語処理とコミュニケーションの側面を人工エージェントと人間の両方で研究しているのはそのためです

MuZeroの研究から現実世界への第一歩

YouTubeとの協力により、オープンソースのVP9コーデックにおける動画圧縮の最適化を行っています

人間のデータなしでの堅牢なリアルタイム文化伝達の学習

この研究では、ディープ強化学習を使用して、テスト時の文化的伝達が可能な人工エージェントを生成します訓練後、私たちのエージェントは、専門家が示したナビゲーションの知識を推測し、思い出すことができますこの知識の転送はリアルタイムで行われ、以前に見たことのないタスクの広範な領域に一般化します

LGBTQ+コミュニティをAI研究で支援する

研究者のケビン・マッキーは、サイエンスフィクションと社会心理学への初期の愛が彼のキャリアに影響を与えたこと、そして彼が「クィアの公正さ」の研究を進めるのに役立ち、人間とAIの協力を支援し、AIがLGBTQ+コミュニティに与える影響を研究していることを語ります

BYOL-Explore ブートストラップ予測による探索

BYOL-Exploreを紹介しますこれは、視覚的に複雑な環境での好奇心に基づいた探索のための概念的にシンプルでありながら一般的なアプローチですBYOL-Exploreは、追加の補助的な目的ではなく、潜在空間での単一の予測損失を最適化することによって、世界表現、世界の動態、および探索方針をすべて一緒に学習します我々は、BYOL-Exploreが視覚的に豊かな3D環境を持つ難解な部分観測可能な連続アクションの困難な探索ベンチマークであるDM-HARD-8で効果的であることを示します

アフリカにおける機械学習の強化を推進する運動のリーダーシップ

オープンな役割を表示する: https://www.deepmind.com/careers/jobs?sort=alphabetical Game Theory and Multi-agentチームの研究エンジニアであるAvishkar Bhoopchandは、DeepMindへの道のりと、彼がアフリカ全土でディープラーニングの知名度を高めるために取り組んでいることについて共有しています。 Deep Learning Indaba 2022について詳しく知るには、毎年開催されるアフリカのAIコミュニティの集まりであるDeep Learning Indaba 2022をご覧ください。今年の8月、チュニジアで開催されます。 仕事の典型的な1日はどのようなものですか? 研究エンジニアおよびテクニカルリードとして、毎日同じではありません。通勤中にポッドキャストやオーディオブックを聴くことから始めることが多いです。朝食後、メールとアドミンに集中してから最初のミーティングに入ります。これらは、チームメンバーとの個別のミーティングやプロジェクトの更新、多様性、公平性、包含(DE&I)の作業グループなど様々です。 午後には、自分のやることリストのための時間を確保しようとします。これらのタスクには、プレゼンテーションの準備、研究論文の読み込み、コードの記述やレビュー、実験の設計と実施、結果の分析などが含まれることがあります。 在宅勤務の場合、私の犬フィンが私を忙しくさせます!彼に教えることは、強化学習(RL)のようなものです – 職場で人工エージェントを訓練する方法のようなものです。そのため、私の時間の多くはディープラーニングや機械学習について考えることに費やされます。 AIに興味を持つようになったきっかけは何ですか? ケープタウン大学で知能エージェントのコースを受講している最中、私の講師がRLを用いてゼロから歩くことを学んだ六脚ロボットのデモを行いました。その瞬間から、人間や動物のメカニズムを使用して学習可能なシステムを構築する可能性について考えることができなくなりました。 当時、南アフリカでは機械学習の応用や研究は実際には選択肢ではありませんでした。私の同僚の多くと同様に、私もソフトウェアエンジニアとして金融業界で働くことになりました。大規模で堅牢なシステムの設計やユーザー要件を満たすための経験を積むことができました。しかし、6年後、私はもっと何かを求めるようになりました。 その頃、ディープラーニングが急速に広まり始めました。最初はCourseraのAndrew…

Find the right Blockchain Investment for you

Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.

Advertising with us