複数の画像やテキストの解釈 Applications - Section 28
新しいAI研究が「SWIM-IR」をリリース!2800万対33の言語にわたる大規模な合成多言語検索データセット
Google Research、Google DeepMind、そしてウォータールー大学の研究者は、多言語リトリーバルにおける限られた人間によって...
トロント大学の研究者が、大規模な材料データセットにおける驚くべき冗長性と、情報豊かなデータの機械学習パフォーマンスの向上における力を明らかにする
AIの登場と共に、その利用は私たちの生活のあらゆる分野で感じられるようになっています。AIはあらゆる生活領域での応用が見...
「マイクロソフト、Azureカスタムチップを発表:クラウドコンピューティングとAI能力を革新する」
産業の持続的な噂の中で、Microsoftの長らく待ち望まれていた発表がイグナイトカンファレンスで明らかになり、テックランドス...
このMITのAI論文では、ロボット操作に革新的な方法を紹介しています:エンコードされた特徴フィールドとビジョン言語モデルによる2Dから3Dのギャップの橋渡し
MITとAIおよび基礎相互作用研究所(IAIFI)の研究チームは、ロボットの操作に革新的なフレームワークを紹介し、予測不可能な...
「GO TO Any Thing(GOAT)」とは、完全に見たことのない環境で、画像、言語、カテゴリのいずれかで指定されたオブジェクトを見つけることができる、ユニバーサルなナビゲーションシステムです
このsystemですGOATは、イリノイ大学アーバナ・シャンペーン校、カーネギーメロン大学、ジョージア工科大学、カリフォルニア...
「浙江大学の研究者がUrbanGIRAFFEを提案し、難しい都市のシーンに対する制御可能な3D認識画像の生成に取り組む」
“` UrbanGIRAFFEは、浙江大学の研究者が提案した写真のようなイメージ合成の手法であり、操作可能なカメラの位置とシー...
セマンティックヒアリング:リアルな環境で特定の音を重点的に集中させたり無視したりしながら、空間認識を維持するための機械学習に基づくヒアラブルデバイスの新しい機能
ワシントン大学とマイクロソフトの研究者は、先進的な機械学習アルゴリズムによって駆動される意味解釈能力を持つノイズキャ...
MITの研究者たちは「MechGPT」を導入しました:メカニクスと材料モデリングにおいてスケール、学問領域、およびモダリティをつなぐ言語ベースのパイオニア
研究者たちは、物質科学の広範な領域において密度の濃い科学的な文書から重要な洞察を効率的に抽出するという困難な課題に直...
『NVIDIAの研究者たちが、現行のCTCモデルと互換性のあるGPU加速の重み付き有限状態トランスデューサ(WFST)ビームサーチデコーダを導入』
最近の人工知能の人気を受けて、自動音声認識(ASR)の分野は非常に進歩しました。これによって音声認識技術や人間とコンピュ...
MetaがEmuビデオとEmu編集を発表:テキストからビデオ生成と精密画像編集の先駆的な進化
急速に進化する生成AIの分野では、効率的で高品質なビデオ生成モデルや正確で多目的な画像編集ツールの実現に向けて課題が残...

- You may be interested
- 洞察を具体的な成果に変える
- 毎日時間を節約する14のGoogle Driveアドオン
- 「チャットボットを使って自動運転車の会...
- 『AI入門』
- 一行のコードでHuggingfaceのデータセット...
- 就職を助けることができる5つの珍しいデー...
- デューク大学の研究者たちは、ポリシース...
- 「トップ40+の生成AIツール(2023年9月)」
- 「物理学と流体力学に応用されたディープ...
- (Samsung no AI to chippu gijutsu no mir...
- 「AI倫理ツールキットが機能する理由を探る」
- 大型言語モデル:DistilBERT — より小型・...
- 「InstaFlowをご紹介します:オープンソー...
- 「パッチのせいかもしれませんか? このAI...
- Rにおけるトップ10のエラーとそれらを修正...
Find your business way
Globalization of Business, We can all achieve our own Success.