Microsoft BingはNVIDIA Tritonを使用して広告配信を高速化

Microsoft Bing speeds up ad delivery using NVIDIA Triton.

Jiusheng Chen氏のチームは加速しました。

彼らは、NVIDIA Triton Inference ServerをNVIDIA A100 Tensor Core GPUで実行することにより、Microsoft Bingのユーザーに対してパーソナライズされた広告を7倍のスループットで低コストで提供しています。

主任ソフトウェアエンジニアリングマネージャーと彼のクルーにとって、これは素晴らしい成果です。

複雑なシステムの調整

Bingの広告サービスは、常に進化している数百のモデルを使用しています。それぞれは、10ミリ秒未満のリクエストに応答する必要があります。これは目に見えるのと同じくらい速いです。

最新のスピードアップは、AIモデルをより高速に実行するためにチームが提供した2つの革新に始まりました:BangとEL-Attention。

これらを併用することで、より少ない時間とコンピュータメモリでより多くの処理を行うための高度な技術が適用されます。モデルトレーニングは、効率化のためにAzure Machine Learningをベースにしています。

NVIDIA A100 MIGで飛行

次に、チームは、広告サービスをNVIDIA T4からA100 GPUにアップグレードしました。

後者のMulti-Instance GPU(MIG)機能を使用すると、1つのGPUを複数のインスタンスに分割できます。

Chen氏のチームは、MIG機能を最大限に活用し、1つの物理的なA100を7つの独立したGPUに変換しました。これにより、チームはGPUあたり7倍のスループットを実現し、推論応答時間は10ミリ秒です。

柔軟で簡単でオープンなソフトウェア

Tritonは、1つのGPUの分離されたインスタンスで異なるランタイムソフトウェア、フレームワーク、AIモードを同時に実行できるようにするため、シフトを可能にしました。

推論ソフトウェアは、ソフトウェアコンテナーで提供されるため、展開が容易です。また、オープンソースのTritonは、時間とともにソフトウェアを改善するコミュニティによって支援されており、NVIDIA AI Enterpriseを通じてエンタープライズグレードのセキュリティとサポートも提供されています。

Tritonを使用してA100 GPU上でBingの広告システムを加速することは、Chen氏が彼の仕事で好む例の1つです。彼はAIのブレイクスルーを見ることができます。

シナリオがしばしば変わる中で、チームの目標は同じままであり、ユーザーと広告主の両方にとって勝利を創造することです。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

「生成AI解放:ソフトウェアエンジニアのためのMLOpsとLLMデプロイメント戦略」

「ジェネラティブAIの活用と未踏の可能性を引き出すためのMLOps戦略とLLM展開ソリューションを探索することで、AIイノベーシ...

人工知能

「Lab Sessions 実験的なAIの新しいコラボレーションのシリーズ」

Lab Sessionsは、アーティストから学者、科学者から学生まで、さまざまな人々との実験的なAIコラボレーションのシリーズです

データサイエンス

オープンソースのベクトルデータベースChromaDBを使用して、セマンティック検索アプリケーションを構築する

はじめに AIアプリケーションとユースケースの台頭に伴い、AIアプリケーションを容易にし、AI開発者が実世界のアプリケーショ...

人工知能

5分で作成するLow-Code GPT AIアプリを作成する

AIとデータベースの相互作用にAIのツール、AINIROとOpenAIのGPTを組み合わせることで、5分で完全なデータベースをCRUDアプリ...

人工知能

BScの後に何をすべきか?トップ10のキャリアオプションを探索する

イントロダクション 科学はしばしば無限の可能性の源であり、さまざまな分野でのさらなる研究や雇用の広大な機会を提供します...

データサイエンス

ジェネラティブAIを通じた感情分析のマスタリング

イントロダクション センチメント分析は、企業が顧客のフィードバックを理解し対応する方法を革新しました。顧客のセンチメン...