複数の画像やテキストの解釈 AI研究 - Section 7
AI 研究とイノベーションの最前線に留まります
このAI研究は、CoDi-2を紹介します:インターリーブされた指示処理とマルチモーダルな出力生成の風景を変える画期的なマルチモーダル大規模言語モデルです
研究者たちは、UCバークレー、Microsoft Azure AI、Zoom、UNC-Chapel Hillによって開発されたCoDi-2 Multimodal Large Langua...
Googleの研究者が新たな大規模言語モデルの能力向上に向けた『Universal Self-Consistency (USC)』を披露
複数の候補者から最も一貫性のある回答を選び出し、特に数理推論やコード生成などのタスクのパフォーマンスを向上させる問題...
マイクロソフトリサーチとジョージア工科大学の研究者が、言語モデルの幻覚の統計的な境界を公表しました
最近、言語モデルで浮かび上がった主要な問題の一つは、言語モデル(LM)が存在しない記事タイトルへの言及を含む誤った情報...
Google AI研究のTranslatotron 3:革新的な教師なし音声対音声翻訳アーキテクチャの発表
音声から音声への翻訳(S2ST)は、言語の壁を取り払うための画期的な技術ですが、並行音声データの不足がその進展を妨げてき...
スターリング-7B AIフィードバックからの強化学習によるLLM
UCバークレーの研究チームが、オープンソースの大規模言語モデル(LLM)であるStarling-7Bを導入しています。このモデルは人...
「マックス・プランク研究所の研究者がPoseGPTを導入:画像やテキストの説明から3D人物のポーズを理解し、論理的に推論するための大規模言語モデル(LLM)を利用した人工知能フレームワーク」
人間の姿勢は、全体的な健康や幸福、さまざまな生活の側面において重要です。座っている、立っている、もしくは寝ている際の...
このAI研究によって、写真-SLAMが発表されました:ポータブルデバイスでのリアルタイム写真写実的マッピングを向上させる
コンピュータビジョンとロボット工学において、カメラによる同時位置推定と地図作成(SLAM)は、自律システムが自ら環境をナ...
ジュネーブ大学の研究者は、多剤耐性(MDR)腸内細菌感染の入院リスクを予測するためのグラフベースの機械学習モデルを調査しています
マシンラーニングは、医療で非常に重要なツールとして登場し、業界のさまざまな側面を革新しています。その主な応用の一つは...
上海人工知能研究所とMITの研究チームが、階層的に制御された再帰ニューラルネットワーク(RNN)の開発を発表しましたこれは効率的な長期依存性モデリングにおける新たなフロンティアです
上海人工知能研究所とMIT CSAIの研究者によって開発された階層的ゲート付き再帰ニューラルネットワーク(HGRN)技術は、線型R...
研究者たちは、アルゴリズムに「味覚」を教えることに成功しました
科学者たちは、アルゴリズムによって個々の人のワインの好みをより正確に予測する方法を教えました
- You may be interested
- 「モンテカルロコンピュータシミュレーシ...
- Pythonにおけるオブジェクト指向プログラ...
- CFXplorer カウンターファクチュアル説明...
- 特定のデータ処理タスクを効率的に解決す...
- ネットワークXによるソーシャルネットワー...
- このAI論文は、大規模な言語モデルを最適...
- VoAGIニュース、7月12日:ChatGPTに関する...
- 「OpenAI関数呼び出しの紹介」
- 「研究者が量子コンピューティングのため...
- Google Researchが、凍結された大規模言語...
- ストリーミングフレームワークの紹介
- Mr. Pavan氏のデータエンジニアリングの道...
- ChatGPTでリードマグネットのアイデアをブ...
- このAIニュースレターは、あなたが必要な...
- PyRCAをご紹介します:AIOpsにおけるRoot ...
Find your business way
Globalization of Business, We can all achieve our own Success.