複数の画像やテキストの解釈 AI研究 - Section 35

AI 研究とイノベーションの最前線に留まります

メリーランド大学とMeta AIの研究者は、「OmnimatteRF」という新しいビデオマッティング手法を提案していますこの手法は、動的な2D前景レイヤーと3D背景モデルを組み合わせたものです

ビデオを複数のレイヤーに分割し、それぞれにアルファマットを持たせ、それらのレイヤーを元のビデオに再構成することは、「...

「CMUの研究者たちは、スロット中心のモデル（Slot-TTA）を用いたテスト時の適応を提案していますこれは、シーンを共通してセグメント化し、再構築するスロット中心のボトルネックを備えた半教師付きモデルです」

コンピュータビジョンの最も困難で重要なタスクの1つは、インスタンスセグメンテーションです。画像や3Dポイントクラウド内の...

ペンシルバニア大学の研究者が、軽量で柔軟、モデルに依存しないオープンソースのAIフレームワーク「Kani」を導入し、言語モデルアプリケーションの構築を行います

大規模言語モデルの応用は人気が高まっています。その驚異的な能力により、ますます洗練されてきています。ツールの使用追跡...

「Google ResearchがMediaPipe FaceStylizerを紹介：少数のショットでの効率的な顔スタイリゼーションのための設計」

近年、研究者や消費者は、拡張現実（AR）を組み合わせたスマートフォンアプリケーションに対する関心を高めています。これに...

「韓国のAI研究がマギキャプチャを紹介：主題とスタイルの概念を統合して高解像度のポートレート画像を生成するための個人化手法」

人々はよく、履歴書や結婚式などに適した高品質の肖像写真を作成するために、写真スタジオに通ったり、高価で時間のかかる画...

「MITの学者たちは、生成型AIの社会的な影響を探るためのシードグラントを授与されました」

「MITの全学派を代表する27人のファイナリストは、技術の民主主義、教育、持続可能性、コミュニケーションなどへの影響を探求...

「タンパク質設計の次は何か？マイクロソフトの研究者がエボディフ：シーケンスファーストのタンパク質エンジニアリングのための画期的なAIフレームワークを紹介」

ディープ生成モデルは、新規タンパク質のインシリコ創造において、ますます有効なツールとなっています。拡散モデルは、最近...

このAI研究は、AstroLLaMAを紹介しますこれは、ArXivからの30万以上の天文学の要約を使用して、LLaMA-2からファインチューンされた7Bパラメーターモデルです

大規模言語モデル（LLM）の登場は、複数の重要な要素が結集したため、多くの分野から注目を集めています。これらの要素には、...

MITとマイクロソフトの研究者が、DoLaという新しいAIデコーディング戦略を紹介しましたこれは、LLMsにおける幻覚を減らすことを目的としています

大規模言語モデル（LLM）の利用により、多くの自然言語処理（NLP）アプリケーションが大きな恩恵を受けてきました。LLMは性能...

「AIを活用したツールにより、3Dプリント可能なモデルの個別化が容易になります」

Style2Fabを使用することで、メーカーは補助具などの3Dプリンタで作成可能なオブジェクトのモデルを迅速にカスタマイズできま...

Find your business way

Globalization of Business, We can all achieve our own Success.

Advertising with us

Web Analytics