複数の画像やテキストの解釈 Technical blog - Section 2

好奇心だけで十分なのか? 好奇心による探索からの新たな振る舞いの有用性について

私たちは、単に好奇心を使って環境を探索したり特定のタスクのボーナス報酬として使用するだけでは、この技術の全ポテンシャ...

教師なしの深層学習により、単一の下側頭顔パッチニューロンにおいて意味的な分離が特定される

私たちの脳は、視覚情報を処理する驚くべき能力を持っています複雑な場面を一目見るだけで、数ミリ秒の間にそれをオブジェク...

マルコフ報酬の表現力について

私たちの主な結果は、報酬が多くのタスクを表現できる一方で、各タスクタイプのインスタンスにはマルコフ報酬関数では捉えら...

模倣学習を用いたインタラクティブエージェントの作成

私たちは、シミュレートされた世界での人間-人間の相互作用の模倣学習と自己教師あり学習の組み合わせによって、非敵対的な人...

兆のトークンからリトリーブして言語モデルを向上させる

言語モデルの改善のための代替手段を探求しますウェブページ、書籍、ニュース、コードなどのテキストパッセージのデータベー...

人工エージェントにおける遵守と執行行動の学習を向上させる偽の規範性

最近の論文では、マルチエージェントの深層強化学習が、社会的な相互作用のモデル、例えば社会的規範の形成などを表現する手...

言語モデルによるレッドチーミング:言語モデルによる言語モデル

私たちの最近の論文では、言語モデル自体を使用して入力を生成することで、言語モデルから有害なテキストを引き出す可能性が...

動詞理解のための画像言語トランスフォーマーの調査

マルチモーダル画像言語トランスフォーマーは、微調整に依存するさまざまなタスク(例:視覚的な質問応答や画像検索)で印象...

人間のデータなしでの堅牢なリアルタイム文化伝達の学習

この研究では、ディープ強化学習を使用して、テスト時の文化的伝達が可能な人工エージェントを生成します訓練後、私たちのエ...

GopherCite 検証済みの引用を使用して回答を支援するための言語モデルの教育

ゴーファーのような言語モデルは、信憑性があるように見えるが実際には偽りの情報を「幻覚」させることがありますこの問題に...

Find your business way

Globalization of Business, We can all achieve our own Success.

Advertising with us