複数の画像やテキストの解釈 Tech News - Section 9

ビデオ編集は、VideoCrafterとともに新しい時代へ高品質なビデオ生成のためのオープンディフュージョンAIモデル

VideoCrafterは新しいオープンソースのビデオ作成および編集スイートです。このスイートは機械学習モデル、拡散モデルによっ...

KAISTの研究者らが「SyncDiffusion」を提案：知覚的な類似度の損失関数から勾配降下法を使って複数の拡散を同期させるためのプラグアンドプレイモジュールです

最近の研究論文では、KAISTの研究者チームが、事前学習済みの拡散モデルを使用して、パノラマ画像の生成を向上させる画期的な...

このAI研究は、事前のイメージングなしで物体のエッジを検出するためのノイズ耐性のある方法を開発しました

コンピュータビジョンでの重要な関心は、堅牢で効率的なエッジ検出アルゴリズムの開発に集中しています。従来の微分演算に基...

予めトレーニングされた基礎モデルは、分子機械学習の未来ですか？前例のないデータセットとGraphium機械学習ライブラリを紹介します

最近の薬剤探索における機械学習の最新の成果は、主にグラフおよび幾何学的ディープラーニングモデルに帰因されています。こ...

「大規模言語モデルにおける早期割れに打ち勝てるか？Google AIがパフォーマンス向上のためにバッチキャリブレーションを提案」

大規模な言語モデルは、最近、自然言語理解や画像分類のさまざまなタスクにおいて強力なツールとして登場しています。しかし...

マイクロソフトエージェントAIがIdea2Imgを導入：自己金融による多モーダルAIフレームワークで、画像の開発とデザインを自動化します

“画像の設計と生成”の目的は、ユーザーからの広範な概念に基づいて画像を生成することです。この入力のアイデア...

「切り分けて学ぶ」による機械学習におけるオブジェクトの状態合成の認識と生成

現実世界には、さまざまなサイズ、色合い、質感を持つ物体が存在します。視覚的な特性、一般的には状態や属性と呼ばれるもの...

「Google Quantum AIは、薬学、化学、および原子力エネルギーに関連する量子計算の応用を探るために3つのケーススタディを紹介します」(Google Quantum AIが、やくがく、かがく、およびげんしりょくエネルギーにかんれんするりょうしけいさんのおうようをさぐるためにみっつのけーすすたでぃをしょうかいします)

さまざまな産業は、量子コンピューティングの変革的な可能性を賞賛していますが、有限サイズの問題に対する応用の実用性は疑...

このAI論文では、エッジコンピュータ上でも高品質な再構築とリアルタイム性能を実現するためのNeRFベースのマッピング手法が提案されています

この論文では、研究者たちはH2-Mappingと呼ばれるNeRFベースのマッピング手法を紹介しました。この手法は、ロボティクス、AR ...

Google AIは、屋外での人間の視点によるシーン理解のためのマルチ属性ビデオデータセットであるSANPOを導入しました

自動運転などのタスクにおいて、AIモデルは道路や歩道の3D構造だけでなく、道路標識や信号機を識別・認識する必要があります...

Find your business way

Globalization of Business, We can all achieve our own Success.

Advertising with us

Web Analytics