複数の画像やテキストの解釈 AI研究 - Section 19

AI 研究とイノベーションの最前線に留まります

UCSDの研究者が、チューリングテストでのGPT-4のパフォーマンスを評価：人間のような欺瞞とコミュニケーション戦略のダイナミクスを明らかにする

GPT-4はUCSDの研究者グループによってインターネット上の一般的なチューリングテストで試験されました。最も優れたGPT-4のプ...

マイクロソフトの研究者たちは「エモーションプロンプト」を発表しました：複数の言語モデルにおけるAIの感情的知性を向上させる

感情的知性は、人間の質の多様なモザイクの中に位置する歴史的な要素です。感情の理解は、感情的なデータを正しく認識し処理...

インテルの研究者たちは、CPU上でLLMs（Large Language Models）をより効率的に展開するための新しい人工知能のアプローチを提案しています

大型言語モデル（LLM）は、その驚異的なパフォーマンスと多様なタスクでの潜在能力により、世界中で話題となっています。テキ...

マイクロソフトの研究者たちは、FP8混合精度トレーニングフレームワークを公開しました：大規模な言語モデルのトレーニング効率を超高速化します

大型言語モデルは、言語生成と理解の能力において以前に類を見ない優れた能力を示しており、論理学、数学、物理学、他の領域...

「MIT研究者がLILOを導入：プログラム合成のための解釈可能なライブラリを学ぶための神経シンボリックフレームワーク」

ビッグ言語モデル（LLM）は、プログラムのさまざまな文脈でプログラムする能力がますます高度になっており、部分的に書かれた...

アマゾンの研究者がフォーチュナを紹介：ディープラーニングにおける不確実性量子化のためのAIライブラリ

人工知能と機械学習の最近の発展は、皆の生活をより容易にしてくれています。その信じられない能力により、AIとMLはあらゆる...

「ハギングフェイスの研究者たちは、Distil-Whisperを紹介しました：高性能でリソースが限られた環境におけるギャップを埋めるコンパクトな音声認識モデル」

ハギングフェイスの研究者たちは、リソース制約のある環境での大規模な事前学習済音声認識モデルの展開の問題に取り組んでき...

このAI研究は、単一の画像を探索可能な3Dシーンに変換する、パノラマニックNeRF（PERF）を紹介します

NeRFは、2D画像から3Dシーンの再構築と視点合成を行うためのディープラーニング技術です。正確な3D表現を構築するには、通常...

このAI研究は、高品質なビデオ生成のための2つの拡散モデル、テキストからビデオ（T2V）モデルと画像からビデオ（I2V）モデルを紹介します

“`html 香港の研究者チームが、高品質な動画生成のための2つのオープンソース拡散モデルを紹介しました。テキストから...

このAI研究は、「Atom」という低ビット量子化技術を導入し、効率的かつ正確な大規模言語モデル（LLM）の提供を行っています

大規模言語モデル（LLM）は、最近の人工知能コミュニティで最新の導入であり、世界中で大きな話題となっています。これらのモ...

Find your business way

Globalization of Business, We can all achieve our own Success.

Advertising with us

Web Analytics