Learn more about Search Results A - Page 810

言語モデルの解毒化における課題

私たちの論文では、言語モデル(LM)とその有毒な言語生成能力に焦点を当てていますLMの有毒性を軽減するためのさまざまな方法の効果、およびそれらの副作用について研究し、分類器ベースの自動有毒性評価の信頼性と限界を調査します

好奇心だけで十分なのか? 好奇心による探索からの新たな振る舞いの有用性について

私たちは、単に好奇心を使って環境を探索したり特定のタスクのボーナス報酬として使用するだけでは、この技術の全ポテンシャルを引き出すことはできず、有用なスキルを見逃してしまいます代わりに、私たちは好奇心に基づく学習中に現れる行動を保持することに焦点を当てることを提案しますこれらの自己発見された行動は、関連するタスクを解決するためのエージェントのレパートリーとして有用なスキルを持っていると考えています

次の1時間の雨を予測する

私たちの生活は天候に依存していますイギリスではいつでも、ある研究によると、国の1/3が過去1時間以内に天気について話し合ったとされ、天候の重要性が日常生活に反映されています天候現象の中でも、雨は特に重要ですなぜなら、雨は私たちの日常の決定に影響を与えるからです傘を持っていくべきか?大雨に見舞われた車両のルートはどうすべきか?屋外イベントにおける安全対策は何か?洪水が発生するかもしれないのか?私たちの最新の研究と最先端のモデルは、次の1〜2時間以内に雨(および他の降水現象)を予測する降水現在予測の科学を進化させていますメットオフィスとの共同執筆による論文が自然に掲載され、天気予測におけるこの重要な大課題に直接取り組んでいます環境科学とAIの連携は、意思決定者のための価値に焦点を当て、降水現在予測の新たな可能性を開拓し、環境が絶えず変化する中での意思決定の課題に対するAIの支援の機会を指摘しています

ロボット用の物理シミュレータを公開する

歩く時、足が地面に触れます書く時、指がペンに触れます物理的な接触が世界との相互作用を可能にしますしかし、このような普通の出来事でも、接触は驚くほど複雑な現象です2つの物体の界面で微小なスケールで起こる接触は、柔らかい場合もあれば硬い場合もあり、弾力的な場合もあればスポンジ状の場合もあり、滑りやすい場合もあれば粘り気のある場合もあります私たちの指先には4つの異なるタイプの触覚センサーがあるのも不思議ではありませんこの微妙な複雑さが、ロボット研究の重要な要素である物理的接触のシミュレーションを難しい課題にしています

教師なしの深層学習により、単一の下側頭顔パッチニューロンにおいて意味的な分離が特定される

私たちの脳は、視覚情報を処理する驚くべき能力を持っています複雑な場面を一目見るだけで、数ミリ秒の間にそれをオブジェクトとその属性(色やサイズなど)に分解し、この情報を使って簡単な言語で場面を説明することができますこのように思われる容易な能力の基礎となるのは、私たちの視覚皮質によって行われる複雑な計算ですこの計算では、数百万の神経の刺激が網膜から送られ、より意味のある形式に変換され、簡単な言語の記述にマッピングできるようになります脳内でこのプロセスがどのように機能するのかを完全に理解するためには、視覚処理の階層の最後で神経の発火によって意味のある情報がどのように表現されるか、そしてそのような表現が主に教えられていない経験からどのように学習されるかを解明する必要があります

マルコフ報酬の表現力について

私たちの主な結果は、報酬が多くのタスクを表現できる一方で、各タスクタイプのインスタンスにはマルコフ報酬関数では捉えられないものが存在することを証明していますその後、私たちは、各タイプのタスクを最適化するための報酬関数を構築するための多項式時間アルゴリズムのセットを提供し、そのような報酬関数が存在しない場合を正しく判断することができます

新しい方法で純粋な数学の美しさを探索する

100年以上前、スリニヴァーサ・ラマヌジャンは、他の誰も気づかなかった数の驚くべきパターンを見る非凡な能力で数学界を驚かせましたこのインド出身の独学の数学者は、彼の洞察を深く直感的で霊的なものとしており、パターンはしばしば鮮やかな夢の中で彼に現れました

模倣学習を用いたインタラクティブエージェントの作成

私たちは、シミュレートされた世界での人間-人間の相互作用の模倣学習と自己教師あり学習の組み合わせによって、非敵対的な人間との対話に成功する多様なインタラクティブエージェント(MIAと呼ぶ)を生み出すことができることを示しますMIAは、非敵対的な人間との対話において75%の成功率を達成しますさらに、階層的なアクション選択などのアーキテクチャとアルゴリズムの技術を特定し、パフォーマンスを向上させることができます

兆のトークンからリトリーブして言語モデルを向上させる

言語モデルの改善のための代替手段を探求しますウェブページ、書籍、ニュース、コードなどのテキストパッセージのデータベースに対して、トランスフォーマを補完するためのリトリーバルを行いますこの手法を「RETRO」と呼んでいます「Retrieval Enhanced TRansfOrmers」の頭文字です

スケールにおける言語モデリング:Gopher、倫理的考慮事項、および情報の検索

言語とその役割は、人間であることの基本的な要素であり、理解や知性を示すことと促進することにおいて重要ですそれは人々に思考や概念を伝え、アイデアを表現し、記憶を創り、相互理解を築く能力を与えますこれらは社会的知性の基盤的な要素ですDeepMindのチームは、言語処理とコミュニケーションの側面を人工エージェントと人間の両方で研究しているのはそのためです

Find the right Blockchain Investment for you

Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.

Advertising with us