複数の画像やテキストの解釈 AI研究 - Section 7
AI 研究とイノベーションの最前線に留まります
このAI研究は、CoDi-2を紹介します:インターリーブされた指示処理とマルチモーダルな出力生成の風景を変える画期的なマルチモーダル大規模言語モデルです
研究者たちは、UCバークレー、Microsoft Azure AI、Zoom、UNC-Chapel Hillによって開発されたCoDi-2 Multimodal Large Langua...
Googleの研究者が新たな大規模言語モデルの能力向上に向けた『Universal Self-Consistency (USC)』を披露
複数の候補者から最も一貫性のある回答を選び出し、特に数理推論やコード生成などのタスクのパフォーマンスを向上させる問題...
マイクロソフトリサーチとジョージア工科大学の研究者が、言語モデルの幻覚の統計的な境界を公表しました
最近、言語モデルで浮かび上がった主要な問題の一つは、言語モデル(LM)が存在しない記事タイトルへの言及を含む誤った情報...
Google AI研究のTranslatotron 3:革新的な教師なし音声対音声翻訳アーキテクチャの発表
音声から音声への翻訳(S2ST)は、言語の壁を取り払うための画期的な技術ですが、並行音声データの不足がその進展を妨げてき...
スターリング-7B AIフィードバックからの強化学習によるLLM
UCバークレーの研究チームが、オープンソースの大規模言語モデル(LLM)であるStarling-7Bを導入しています。このモデルは人...
「マックス・プランク研究所の研究者がPoseGPTを導入:画像やテキストの説明から3D人物のポーズを理解し、論理的に推論するための大規模言語モデル(LLM)を利用した人工知能フレームワーク」
人間の姿勢は、全体的な健康や幸福、さまざまな生活の側面において重要です。座っている、立っている、もしくは寝ている際の...
このAI研究によって、写真-SLAMが発表されました:ポータブルデバイスでのリアルタイム写真写実的マッピングを向上させる
コンピュータビジョンとロボット工学において、カメラによる同時位置推定と地図作成(SLAM)は、自律システムが自ら環境をナ...
ジュネーブ大学の研究者は、多剤耐性(MDR)腸内細菌感染の入院リスクを予測するためのグラフベースの機械学習モデルを調査しています
マシンラーニングは、医療で非常に重要なツールとして登場し、業界のさまざまな側面を革新しています。その主な応用の一つは...
上海人工知能研究所とMITの研究チームが、階層的に制御された再帰ニューラルネットワーク(RNN)の開発を発表しましたこれは効率的な長期依存性モデリングにおける新たなフロンティアです
上海人工知能研究所とMIT CSAIの研究者によって開発された階層的ゲート付き再帰ニューラルネットワーク(HGRN)技術は、線型R...
研究者たちは、アルゴリズムに「味覚」を教えることに成功しました
科学者たちは、アルゴリズムによって個々の人のワインの好みをより正確に予測する方法を教えました

- You may be interested
- 「人間と機械の相互作用の秘密を解き放つ...
- 「Salesforce Data Cloudを使用して、Amaz...
- 「現実的なシミュレーションを用いたデー...
- 「Hugging Faceを使用してLLMsを使ったテ...
- コロンビア大学とAppleの研究者が『フェレ...
- 「私は初めてのデータの仕事に就きました...
- 自動車産業における生成AIの画期的な影響
- 「ベビーブーマーが引退するにつれ、ドイ...
- ソフトウェア開発におけるAIの将来:トレ...
- ギアに乗り込んでください:「Forza Motor...
- 『事実と数字で語るタイタニックの物語』
- 「生成AIゴールドラッシュで誰がお金を稼...
- 成功に導くデータチームの意思決定
- Amazon Lexの新しい生成AI機能で、セルフ...
- カスタムレンズを使用して、優れたアーキ...
Find your business way
Globalization of Business, We can all achieve our own Success.