複数の画像やテキストの解釈 Applications - Section 32

この中国のAI研究は、最新のSOTAビジュアル言語モデルGPT-4V(ision)の詳細な評価と自動運転シナリオへの応用を提供しています

上海人工知能研究所、GigaAI、華東師範大学、香港中文大学、WeRide.aiの研究チームは、自律走行シナリオでのGPT-4V(ision)と...

AdobeのAI研究が提案する「ラージリコンストラクションモデル（LRM）」は、単一の入力画像からオブジェクトの3Dモデルを5秒以内に予測するというものです

多くの研究者たちは、任意の2D画像を瞬時に3Dモデルに変換できる世界を想像してきました。この分野の研究は、これらの長年の...

3Dボディモデルに音声が付きました：Meta AIが完全な人体に対して正確な3D空間音響を生成できる人工知能モデルを紹介

知識とコンピューテーションヴィジョン、人工知能（AI）の補完分野の進展により、人間の行動を再現し理解するインテリジェン...

Google AIが簡単なエンドツーエンドの拡散ベースのテキスト読み上げE3-TTSを提案します：拡散に基づくシンプルで効率的なエンドツーエンドのテキスト読み上げモデルに基づくものです

機械学習において、拡散モデルは画像や音声生成のタスクによく使われる生成モデルです。拡散モデルは、複雑なデータ分布をよ...

ディープマインドのグラフキャストに会いましょう：機械学習による天気予報の飛躍

天気予報技術の重要な進展として、Google DeepMindは画期的な機械学習モデルである「GraphCast」を紹介しました。このAIツー...

オートフォーマリゼーションは、非公式と公式の言語のギャップを埋めることができるのでしょうか？MMAと出会ってください：フィールドを革新している多言語および多ドメインのデータセット

コンピュータが自動的にチェック可能な形式で記述された数学的内容は、標準的な数学として言及されます。数学者は、HOL Light...

このAI論文は、機械学習パイプライン内のさまざまなタイプの漏えいについて包括的な概要と議論を提供しています

機械学習（ML）は、予測モデリング、意思決定支援、洞察的なデータ解釈を実現することにより、医学、物理学、気象学、気候解...

ロコムジョコに会おう：厳格な評価と比較のために設計された新しい機械学習ベンチマーク

Intelligent Autonomous Systems Group、Locomotion Laboratory、German Research Center for AI、Centre for Cognitive Scie...

「オックスフォード大学と西安交通大学の研究者たちが、先端メモリ技術での相変化材料のシミュレーションに向けた革新的な機械学習モデルを発表」

相変化材料の理解と最先端のメモリ技術の開発には、コンピュータシミュレーションの利用が大きなメリットがあります。ただし...

シンガポール国立大学（NTU）の研究者が提案する「OtterHD-8B」という革新的なマルチモーダルAIモデルは、「Fuyu-8B」から進化したものである

シンガポールのナニヤン工科大学のS-Labの研究者たちは、高解像度の視覚入力を正確に解釈するために特別に設計された画期的な...

Find your business way

Globalization of Business, We can all achieve our own Success.

Advertising with us

Web Analytics