Learn more about Search Results エージェント - Page 64
- You may be interested
- Cox回帰の隠されたダークシークレット:Co...
- 「OpenAI Dev Day 2023 創設者サム・オル...
- 「はい!OpenTelemetryはシステムのセキュ...
- ロボット犬は、人間よりも侵略的なヒアリ...
- AIコンテンツ検出機はどのように機能する...
- 「OpenAIのGPTストアで稼ぐための11のカス...
- 犯罪者が自分たちのChatGPTクローンを作成...
- DLノート:勾配降下法
- 「検索補完生成を用いてより能力の高いLLM...
- 「EU AI法案:AIの未来における有望な一歩...
- 「BeautifulSoupを使ったWebスクレイピン...
- 「自動運転車の NavTech を使用した脳手術...
- 「もし私たちが複雑過ぎるモデルを簡単に...
- 「AWSは責任ある生成AIへの取り組みを再確...
- TSMixer グーグルによる最新の予測モデル
人間中心のメカニズム設計とデモクラティックAI
私たちの最近の論文では、Nature Human Behaviourに掲載され、ディープ強化学習(RL)を使用して、シンプルなゲームにおいて人々が多数派で賛成する経済政策を見つけることができることを概念実証しましたこの論文は、AI研究における重要な課題である、人間の価値と一致するAIシステムを訓練する方法について取り上げています
DeepMindの最新の研究(ICML 2022)
今週末から、第39回国際機械学習会議(ICML 2022)が2022年7月17日から23日まで、アメリカのメリーランド州ボルチモアのボルチモア・コンベンションセンターでハイブリッド形式で開催されます人工知能、データサイエンス、機械ビジョン、計算生物学、音声認識などの分野で研究を行っている研究者たちが、機械学習の最先端の研究成果を発表し、出版します
AI研究の善循環
最近、私たちはDeepMindの研究科学者であるペタル・ヴェリチコビッチさんに取材しましたペタルさんは共著者とともに、彼の論文「The CLRS Algorithmic Reasoning Benchmark」をアメリカのメリーランド州ボルチモアで開催されるICML 2022で発表します
科学者が本当のスーパーヒーローであることを実感する
私たちのマルチエージェント研究チームの研究エンジニアであるエドガー・ドゥエニェス・グスマンにお会いください彼は、ゲーム理論、コンピュータサイエンス、社会進化の知識を活用して、AIエージェントがより良く協力するための取り組みを行っています
モーターコントロールから具現化された知能へ
人間や動物の動きを用いて、ロボットにボールをドリブルさせることや、シミュレートされた人型キャラクターに箱を運ばせたりサッカーをさせることを教える 試行錯誤を通じて障害物コースを進む方法を学ぶ人型キャラクター。これにより独特な解決策が生まれることがあります。 Heessら「Emergence of locomotion behaviours in rich environments」(2017)より。 5年前、完全に関節の動く人型キャラクターに障害物コースを進む方法を教えるという課題に取り組みました。これは強化学習(RL)が試行錯誤を通じて何ができるかを示しましたが、具体的な知識がない状態から各関節にどのような力を加えるべきかを知るためには、多くのデータが必要でした。エージェントはランダムな体の震えから始まり、すぐに地面に倒れてしまいました。この問題は、以前に学んだ動きを再利用することで緩和することができます。 以前に学んだ動きの再利用:エージェントが「立ち上がる」ためには大量のデータが必要でした。初めはどの関節にどのような力を加えるべきかを知らなかったため、エージェントはランダムな体の震えから始まり、すぐに地面に倒れてしまいました。この問題は、以前に学んだ動きを再利用することで緩和することができます。 独特な動き:エージェントがついに障害物コースを進む方法を学んだとしても、不自然な(しかし面白い)動きパターンで進むことになります。これは、ロボットなどの実際の応用には非現実的である可能性があります。 ここでは、これらの課題に対する解決策であるニューラル確率モーター原理(NPMP)と呼ばれる手法を説明し、人型フットボールの論文でどのようにこの手法が使用されているかについても議論します。この論文は、本日Science Roboticsで公開されました。 また、この手法は、ビジョンからの人型の全身操作(例:物体を運ぶ人型)や現実世界でのロボット制御(例:ボールをドリブルするロボット)も可能にすることについても議論します。 NPMPを使用してデータを制御可能なモータープリミティブに絞り込む NPMPは、短期間のモーター意図を低レベルの制御信号に変換する汎用のモーター制御モジュールであり、オフラインまたはRLを介して動作キャプチャ(MoCap)データを模倣することで訓練されます。このMoCapデータは、興味のある動作を行う人間や動物にトラッカーを装着して記録されます。 MoCap軌跡(グレーで表示)を模倣するエージェント このモデルには2つの部分があります: 将来の軌跡を受け取り、モーター意図に圧縮するエンコーダー。 エージェントの現在の状態とこのモーター意図に基づいて次のアクションを生成する低レベルコントローラー。 NPMPモデルはまず参照データを低レベルコントローラーに絞り込みます(左)。この低レベルコントローラーは、新しいタスクにプラグアンドプレイのモーター制御モジュールとして使用できます(右) トレーニング後、低レベルコントローラは新しいタスクを学習するために再利用できます。一方、高レベルコントローラはモーターの意図を直接最適化することができます。これにより、効率的な探索が可能になります。ランダムにサンプリングされたモーターの意図でも、連続した行動が生成されるため、最終的な解決策が制約されます。 ヒューマノイドフットボールにおける発生的なチーム協調…
AIとの対話:より優れた言語モデルの構築
私たちの新しい論文「AIとの対話:人間の価値観に合わせた言語モデルの調整」は、異なるアプローチを探求しています人間と人工会話エージェントの間で成功するコミュニケーションがどのように見え、このような文脈での対話を導くべき価値観は何かを問いかけます
私のDeepMindインターンからメンターへの道のり
元インターンであり、現在はインターンマネージャーとして活躍するリチャード・エベレット氏は、DeepMindへの道のりを語り、DeepMindを志す人々に対してのアドバイスやヒントを共有しています2023年のインターンシップ応募は9月16日に開始されますので、詳細についてはhttps//dpmd.ai/internshipsatdeepmindをご覧ください
AlphaTensorを使用して新しいアルゴリズムを発見する
本日、Natureに掲載された私たちの論文では、AlphaTensorという初めての人工知能(AI)システムを紹介しましたこのシステムは、行列の乗算といった基礎的なタスクのための新しい効率的で証明可能なアルゴリズムを発見するためのものですこれにより、50年にわたる数学の未解決問題である行列の乗算を最速で行う方法を見つけることが可能となりましたこの論文はDeepMindがAIを使って科学を進め、最も基本的な問題を解決するための礎となるものです私たちのAlphaTensorシステムは、将棋やチェス、囲碁などのボードゲームで超人的な成績を収めたエージェントであるAlphaZeroを基にしており、この論文ではAlphaZeroがゲームから未解決の数学の問題に挑戦するまでの道のりを示しています
正しい報酬によって望ましくない目標が生じる方法
AIシステムをますます高度化するにつれて、私たちはそれらが望ましくない目標を追求しないようにする必要がありますAIエージェントのこのような振る舞いは、仕様ゲーミングと呼ばれるものであり、報酬の選択が不適切であることを利用しています私たちの最新の論文では、AIシステムが意図しない目標を追求するように学習する可能性のある、より微妙なメカニズムである「目標誤解釈(GMG)」を探求していますGMGは、システムの能力が成功裏に一般化する一方で、目標が望ましいように一般化しない場合に発生しますしたがって、システムは誤った目標を上手に追求してしまいます重要な点は、仕様ゲーミングとは異なり、GMGはAIシステムが正しい仕様で訓練されている場合でも発生する可能性があるということです
AIモデルの知覚を測定する
知覚は、感覚を通じて世界を経験するプロセスであり、知能の重要な部分ですそして、人間レベルの知覚的な世界理解能力を持つエージェントを構築することは、ロボット工学、自動運転車、パーソナルアシスタント、医療画像など、ますます重要な課題ですが、それは困難な課題でもありますそこで、本日は、モデルの知覚能力を評価するための、実世界のビデオを使用したマルチモーダルベンチマークである「知覚テスト」を紹介いたします
Find the right Blockchain Investment for you
Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.