複数の画像やテキストの解釈 Tech News - Section 87

MITが革新的なAIツールを発表：すべての能力レベルのユーザーに対して適応可能で詳細豊富なキャプションを使用して、チャートの解釈とアクセシビリティを向上させる

複雑なグラフや図のアクセシビリティと理解を向上させるための重要な一歩として、MITの研究チームがVisTextと呼ばれる画期的...

LLM（Large Language Models）は、厳密に検証可能な数学的証明を生成できるのでしょうか？LeanDojoにご参加ください：Lean Proof Assistantで形式的な定理を証明するためのツールキット、ベンチマーク、およびモデルを備えたオープンソースのAIプレイグラウンド

人工知能と機械学習は、現代のトレンドとなっています。AIの進歩により、新たなイノベーションが人間と機械の相互作用を変革...

百度Ernie 3.5が中国語AIのチャンピオンとして登場：しかし、ChatGPTより本当に優れているのか？

中国語AI市場における興奮すべきブレークスルーとして、有名な検索エンジンプロバイダであるBaiduが最新モデルであるErnie 3....

ToolQAとは外部ツールを使用した質問応答のための大規模言語モデル（LLM）の能力を評価する新しいデータセット

大規模言語モデル（LLM）は、自然言語処理（NLP）と自然言語理解（NLU）の分野で非常に効果的であることが証明されています。...

Contextual AIは、VQAv2においてFlamingoを9%上回る（56->65%）ビジョン補完言語モデルのためのAIフレームワークLENSを導入しました

大規模言語モデル（LLM）は、最近の数年間で自然言語理解を変革し、ゼロショットおよびフューショットの環境での特に意味理解...

3B、4B、9B のスケールで 5 つの新しいマルチモーダルモデルを備えた OpenFlamingo チームが、前モデルを上回る OpenFlamingo v2 をリリースしました

ワシントン大学、スタンフォード大学、AI2、UCSB、Googleの研究者グループは、最近OpenFlamingoプロジェクトを開発しました。...

FastSAMとは、最小限の計算負荷で高性能のセグメンテーションを実現する画期的なリアルタイムソリューションです

セグメントアニシングモデル（SAM）は、この分野での新しい提案です。これは画像のセグメント化を正確に行うために、複数のユ...

Webスケールトレーニング解放：DeepMindがOWLv2とOWL-STを紹介、未知語彙物体検出の革新的ツール、前例のない自己学習技術によって駆動されます

オープンボキャブラリーの物体検出は、さまざまな実世界のコンピュータビジョンタスクにおいて重要な要素です。ただし、検出...

DORSalとは 3Dシーンの生成とオブジェクトレベルの編集のための3D構造拡散モデル

人工知能は、Generative AIとLarge Language Models（LLMs）の導入により進化しています。GPT、BERT、PaLMなどのよく知られた...

LOMO（LOw-Memory Optimization）をご紹介します：メモリ使用量を削減するために、勾配計算とパラメータの更新を1つのステップで融合する新しいAIオプティマイザです

Large Language Models（LLMs）は、出現やグロッキングのような素晴らしいスキルや、モデルサイズの持続的な増加などを通じて...

Find your business way

Globalization of Business, We can all achieve our own Success.

Advertising with us

Web Analytics