複数の画像やテキストの解釈 Applications - Section 11

Amazon AlexaのAI研究者がQUADRoを発表：QAシステムの向上に向けた画期的なリソースで、440,000以上のアノテーション付きの例があります

人工知能（AI）と機械学習（ML）の能力は、あらゆる可能な産業に進出することを成功裏に可能にしました。最近では、大規模言...

『Google AI Researchが効率的な連成振動子のシミュレーションに革新的な量子アルゴリズムを導入』

古典力学は、物体の運動、それに作用する力、およびその活動に関連付けられたエネルギーについて扱います。量子力学は、物質...

マイクロソフトと清華大学の研究者は、「SCA（Segment and Caption Anything）を提案し、SAMモデルに地域キャプションの生成能力を効率的に装備する」と述べています

コンピュータビジョンと自然言語処理の交差点では、画像内のエンティティの領域キャプションの生成の課題に常に取り組んでき...

このAI論文は、高品質な3Dセグメンテーションを実現するために、与えられたシーン内の任意のオブジェクトのためのセグメントエニシングのための高品質（SANeRF-HQ）フレームワークを紹介しています

香港科技大学、卡内基梅隆大学和达特茅斯学院的研究人员开发了名为SANeRF-HQ（High-Quality的NeRF任意物体分割）的方法，以在...

「大規模言語モデルをより効率的に最適化できるのか？LLMの効率性に関するアルゴリズムの進化についての包括的な調査をご覧ください」

より効率的に大規模言語モデルを最適化できるのか？マイクロソフト、南カリフォルニア大学、オハイオ州立大学など、複数の組...

AI（人工知能）はキッチンを乗っ取っているのか？マクドナルドがGoogleと手を結び、GenAIを展開する

ファストフード技術を再定義する動きとして、マクドナルドとGoogleは2024年からGenerative AIを展開するためのパートナーシッ...

このAI研究は、大規模言語モデルにおける不誠実さのメカニズムを明らかにする：プロンプトエンジニアリングとニューラルネットワーク分析に深く没入する

大規模な言語モデル（LLM）の理解とその正直な行動の促進は、これらのモデルが成長し、社会に広く受け入れられるようになった...

「GPS ガウシアンと出会う：リアルタイムにキャラクターの新しい視点を合成するための新たな人工知能アプローチ」

マルチビューカメラシステムの重要な機能の1つは、ソースの写真を使用して新しい視点から写真のような画像を生成する新規ビュ...

『NYU研究者が提案するGPQA 生物学、物理学、化学の3つの領域の専門家が作成した448の多肢選択問題からなる難解なデータセット』

大型言語モデル（LLM）は人工知能（AI）の最前線にあり、この急速に変化する分野で人間のスキルを凌駕する可能性を示していま...

アドビの研究者たちは、『DMV3D』という新しい3D生成手法を提案していますこの手法は、トランスフォーマーベースの3D大規模再構築モデルを用いて、マルチビューディフュージョンのノイズを除去します

拡張現実（AR）、仮想現実（VR）、ロボティクス、ゲームにおける3Dアセットの作成には共通の課題が存在します。複雑な3Dアセ...

Find your business way

Globalization of Business, We can all achieve our own Success.

Advertising with us

Web Analytics