複数の画像やテキストの解釈 機械学習 - Section 198
データから洞察を抽出し、予測を行う際の機械学習の力を発見してください
検索増強視覚言語事前学習
Google Research Perceptionチームの学生研究者Ziniu Huと研究科学者Alireza Fathiによる投稿 T5、GPT-3、PaLM、Flamingo、Pa...
AVFormer:凍結した音声モデルにビジョンを注入して、ゼロショットAV-ASRを実現する
Google Researchの研究科学者、Arsha NagraniとPaul Hongsuck Seoによる投稿 自動音声認識(ASR)は、会議通話、ストリームビ...
ビジュアルキャプション:大規模言語モデルを使用して、動的なビジュアルを備えたビデオ会議を補完する
Google Augmented Realityのリサーチサイエンティスト、Ruofei DuとシニアスタッフリサーチサイエンティストのAlex Olwalが投...
多言語での音声合成の評価には、SQuIdを使用する
Googleの研究科学者Thibault Sellamです。 以前、私たちは1000言語イニシアチブとUniversal Speech Modelを紹介しました。こ...
スピードは必要なすべてです:GPU意識の最適化による大規模拡散モデルのオンデバイス加速化
コアシステム&エクスペリエンスのソフトウェアエンジニアであるJuhyun LeeとRaman Sarokinによる投稿 画像生成のための大...
アクセラレータの加速化:科学者がGPUとAIでCERNのHPCを高速化
注:これは、高性能コンピューティングを利用した科学を前進させる研究者のシリーズの一環です。 Maria Gironeは、高速コンピ...
Microsoft BingはNVIDIA Tritonを使用して広告配信を高速化
Jiusheng Chen氏のチームは加速しました。 彼らは、NVIDIA Triton Inference ServerをNVIDIA A100 Tensor Core GPUで実行する...
魚の養殖スタートアップ、AIを投入して水産養殖をより効率的かつ持続可能にする
海洋生物学の学生だったJosef Melchnerは、イルカ、クジラ、魚を探すために毎日海をクルーズすることを常に夢見ていましたが...
AIを活用した空中監視:UCSBイニシアチブがNVIDIA RTXを使い、宇宙の脅威を撃退する目的で立ち上がる
数か月ごとに流星群が起こると、観察者は夜空に散らばる流れ星や光の筋が輝く見事な光景を見ることができます。 通常、流星は...
メイカーに会おう:ソフトウェアエンジニアがNVIDIA Jetsonを活用して自律運転スケートパークを構築
Kirk Kaiser Kirk Kaiserは、自転車に乗り新聞を配達するというプレイヤーが、通りの中央に出現するランプなどの障害物に遭遇...
- You may be interested
- Googleは、2,000万ドルの寄付を行い、サイ...
- 『Photoshopを越えて:Inst-Inpaintが拡散...
- 「Cを使用してLLMsを最適化し、GPT、Lama...
- 人工知能は人間を置き換えるのか?
- 「DALL·E 3はどのように作られましたか?...
- 「大規模な言語モデルの公正な評価に向けて」
- スマートフォンの脆弱性の発見により、ハ...
- AIのパイオニア、フェイ・フェイ・リー:A...
- マルチAIの協力により、大規模な言語モデ...
- 「Polarsによるデータパイプライン:ステ...
- AudioCraft Metaの音声と音楽のための生成AI
- 「AI言語モデルにおける迅速なエンジニア...
- 「全てのOECDおよびG20加盟国において、イ...
- 「チャットGPTとAIを使ってオンラインでお...
- PySparkでのランダムフォレスト回帰の実装...
Find your business way
Globalization of Business, We can all achieve our own Success.