複数の画像やテキストの解釈 AI研究 - Section 71

AI 研究とイノベーションの最前線に留まります

2023年にフォローすべきトップ10のAIインフルエンサー

イントロダクション先端技術と驚くべき可能性によって駆動される世界で、AIの絶えず進化する領域に遅れをとらないことは、ス...

マイクロソフトの研究者がKOSMOS-2を紹介：視覚世界に根付くことができるマルチモーダルな大規模言語モデル

マルチモーダル大規模言語モデル（MLLMs）は、言語、ビジョン、ビジョン言語のタスクを含むさまざまな活動で一般的なインター...

コンピュータビジョンシステムは、画像認識と生成を結びつけたものです

MAGEは、通常は別々に訓練される画像生成と認識の2つの主要なタスクを1つのシステムに統合します

希望、恐怖、そしてAI：AIツールに対する消費者の態度に関する最新の調査結果

米国の消費者が人工知能（AI）に関する意見と認識について述べた最新の「Trust Survey」の結果を明らかにしたThe Vergeの報告...

マイクロソフトリサーチは、競合モデルよりも大幅に小さいサイズで、Pythonコーディングに特化した新しい大規模言語モデルphi-1を紹介しました

トランスフォーマーのデザインが発見されて以来、大規模な人工ニューラルネットワークのトレーニングの技術は飛躍的に進歩し...

スタンフォード大学の研究者がSequenceMatchを紹介：模倣学習損失を用いたLLMsのトレーニング

自己回帰モデルは、変数の現在の値が過去の値に大きく依存するという直感に基づいた統計モデルの一種です。つまり、モデルは...

プリンストン大学の研究者が、自然界の写実的な3Dシーンの手続き生成器であるInfinigenを紹介しました

プリンストン大学の研究チームは、「プロシージャルジェネレーションを使用した無限の写実的な世界」という最近の論文で、画...

Allen Institute for AI の研究者が、自然言語の指示に基づいて複雑で構成的な視覚的タスクを解決するための神経記号アプローチである VISPROG を紹介します

汎用AIシステムを探すことで、熟練したエンドツーエンドトレーニングモデルの開発が促進され、多くのモデルがユーザーがモデ...

研究者たちは、新しい量子光源を開発しました

その装置は単一光子のストリームを放出し、光量子コンピュータの基盤となる可能性があります

スタンフォード大学、コーネル大学、オックスフォード大学の新しいAI研究は、単一の画像のわずかなインスタンスからオブジェクトの固有性を発見する生成モデルを紹介しています

バラの本質は、その独特の形状、質感、および材料組成で構成されています。これを使用して、さまざまな位置で、さまざまな形...

Find your business way

Globalization of Business, We can all achieve our own Success.

Advertising with us

Web Analytics