複数の画像やテキストの解釈 機械学習 - Section 198
データから洞察を抽出し、予測を行う際の機械学習の力を発見してください
検索増強視覚言語事前学習
Google Research Perceptionチームの学生研究者Ziniu Huと研究科学者Alireza Fathiによる投稿 T5、GPT-3、PaLM、Flamingo、Pa...
AVFormer:凍結した音声モデルにビジョンを注入して、ゼロショットAV-ASRを実現する
Google Researchの研究科学者、Arsha NagraniとPaul Hongsuck Seoによる投稿 自動音声認識(ASR)は、会議通話、ストリームビ...
ビジュアルキャプション:大規模言語モデルを使用して、動的なビジュアルを備えたビデオ会議を補完する
Google Augmented Realityのリサーチサイエンティスト、Ruofei DuとシニアスタッフリサーチサイエンティストのAlex Olwalが投...
多言語での音声合成の評価には、SQuIdを使用する
Googleの研究科学者Thibault Sellamです。 以前、私たちは1000言語イニシアチブとUniversal Speech Modelを紹介しました。こ...
スピードは必要なすべてです:GPU意識の最適化による大規模拡散モデルのオンデバイス加速化
コアシステム&エクスペリエンスのソフトウェアエンジニアであるJuhyun LeeとRaman Sarokinによる投稿 画像生成のための大...
アクセラレータの加速化:科学者がGPUとAIでCERNのHPCを高速化
注:これは、高性能コンピューティングを利用した科学を前進させる研究者のシリーズの一環です。 Maria Gironeは、高速コンピ...
Microsoft BingはNVIDIA Tritonを使用して広告配信を高速化
Jiusheng Chen氏のチームは加速しました。 彼らは、NVIDIA Triton Inference ServerをNVIDIA A100 Tensor Core GPUで実行する...
魚の養殖スタートアップ、AIを投入して水産養殖をより効率的かつ持続可能にする
海洋生物学の学生だったJosef Melchnerは、イルカ、クジラ、魚を探すために毎日海をクルーズすることを常に夢見ていましたが...
AIを活用した空中監視:UCSBイニシアチブがNVIDIA RTXを使い、宇宙の脅威を撃退する目的で立ち上がる
数か月ごとに流星群が起こると、観察者は夜空に散らばる流れ星や光の筋が輝く見事な光景を見ることができます。 通常、流星は...
メイカーに会おう:ソフトウェアエンジニアがNVIDIA Jetsonを活用して自律運転スケートパークを構築
Kirk Kaiser Kirk Kaiserは、自転車に乗り新聞を配達するというプレイヤーが、通りの中央に出現するランプなどの障害物に遭遇...
- You may be interested
- 「ラジャン・セトゥラマンと一緒にデータ...
- 「ChatGPTにおける適切なプロンプト設計の...
- 「グローバル人工知能市場は31%の急成長...
- 「NTU SingaporeのこのAI論文は、モーショ...
- 「データ駆動型ストーリーテリングにおけ...
- 『AIのおそらく知られていないトップ4の活...
- モンテカルロ法
- 「Pythonをマスターするための無料の5冊...
- 畳み込みニューラルネットワーク ― 直感的...
- ピクセルを説明的なラベルに変換する:Ten...
- 最適なチャートを選ぶことで、洞察を最大...
- 「Llama 2がコーディングを学ぶ」
- トランスフォーマーによるグラフ分類
- 「特殊ガラスの構造と開発における特定の...
- NVIDIAは、NTT DOCOMOと協力して世界初のG...
Find your business way
Globalization of Business, We can all achieve our own Success.