複数の画像やテキストの解釈 Technical blog – Section 2

私たちは、単に好奇心を使って環境を探索したり特定のタスクのボーナス報酬として使用するだけでは、この技術の全ポテンシャ...

私たちの脳は、視覚情報を処理する驚くべき能力を持っています複雑な場面を一目見るだけで、数ミリ秒の間にそれをオブジェク...

私たちの主な結果は、報酬が多くのタスクを表現できる一方で、各タスクタイプのインスタンスにはマルコフ報酬関数では捉えら...

私たちは、シミュレートされた世界での人間-人間の相互作用の模倣学習と自己教師あり学習の組み合わせによって、非敵対的な人...

言語モデルの改善のための代替手段を探求しますウェブページ、書籍、ニュース、コードなどのテキストパッセージのデータベー...

最近の論文では、マルチエージェントの深層強化学習が、社会的な相互作用のモデル、例えば社会的規範の形成などを表現する手...

私たちの最近の論文では、言語モデル自体を使用して入力を生成することで、言語モデルから有害なテキストを引き出す可能性が...

マルチモーダル画像言語トランスフォーマーは、微調整に依存するさまざまなタスク（例：視覚的な質問応答や画像検索）で印象...

この研究では、ディープ強化学習を使用して、テスト時の文化的伝達が可能な人工エージェントを生成します訓練後、私たちのエ...

ゴーファーのような言語モデルは、信憑性があるように見えるが実際には偽りの情報を「幻覚」させることがありますこの問題に...

複数の画像やテキストの解釈 Technical blog - Section 2