「Nvidia Triton Inference Serverを使用してPyTorchモデルをデプロイする」

Deploying PyTorch models using Nvidia Triton Inference Server

柔軟で高性能なモデルサービングソリューション

Unsplashからの画像

機械学習(ML)の価値は、モデルのホスティングと推論に到達したときに本当に認識されます。モデルがスケーリングアップおよびスケーリングダウンするのに役立つ、高性能なモデルサービングソリューションがなければ、MLワークロードを本番環境で運用することは困難です。

モデルサーバーとは何ですか/モデルサービングとは何ですか? モデルサーバーは、MLの世界におけるウェブサーバーに相当するものです。モデルに大量のハードウェアを投入するだけでは十分ではありません。クライアントのリクエストを効率的に処理し、アプリケーションが受けているトラフィックに対応するために必要なハードウェアを適切に割り当てるための通信レイヤーが必要です。モデルサーバーはユーザーにとって調整可能な機能です。gRPC vs RESTなどの要素を制御することで、レイテンシの観点からパフォーマンスを最大化できます。人気のあるモデルサーバーの例は以下の通りです。

  • TensorFlow Serving
  • TorchServe
  • Multi-Model Server (MMS)
  • Deep Java Library (DJL)

今日私たちが探求するのはNvidia Triton Inference Serverです。高度に柔軟かつ高性能なモデルサービングソリューションです。各モデルサーバーは、モデルアーティファクトと推論スクリプトが、それ自体が理解できる独自の方法で提示される必要があります。本記事では、サンプルのPyTorchモデルを取り上げ、Triton Inference Serverを利用してホストする方法を示します。

注意:この記事では、機械学習の基本的な理解があり、モデルの構築についての理論には触れません。Pythonの習熟度とDockerコンテナの基本的な理解も前提としています。また、開発にはSageMaker Classic Notebook Instanceで作業するため、必要に応じてAWSアカウントを作成してください(他の場所でもこのサンプルを実行することもできます)。

免責事項:私はAWSの機械学習アーキテクトであり、私の意見は私自身のものです。

なぜTriton Inference Serverなのか?

Triton Inference Serverは、次のようなさまざまな利点を持つオープンソースのモデルサービングソリューションです。

  1. フレームワークのサポート:Tritonは、ネイティブで多数の…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

「スノーケルAIのCEO兼共同創設者、アレックス・ラットナー - インタビューシリーズ」

アレックス・ラトナーは、スタンフォードAIラボを母体とする会社、Snorkel AIのCEO兼共同創設者ですSnorkel AIは、手作業のAI...

人工知能

「アナコンダのCEO兼共同創業者、ピーターウォングによるインタビューシリーズ」

ピーター・ワンはAnacondaのCEO兼共同創設者ですAnaconda(以前はContinuum Analyticsとして知られる)を設立する前は、ピー...

機械学習

「機械学習 vs AI vs ディープラーニング vs ニューラルネットワーク:違いは何ですか?」

テクノロジーの急速な進化は、ビジネスが効率化のために洗練されたアルゴリズムにますます頼ることで、私たちの日常生活を形...

人工知能

「Ami Hever、UVeyeの共同創設者兼CEO - インタビューシリーズ」

עמיר חבר הוא המנכל והמייסד של UVeye, סטארט-אפ ראיה ממוחשבת בלמידה עמוקה, המציבה את התקן הגלובלי לבדיקת רכבים עם זיהוי...

AIニュース

OpenAIのCEOであるSam Altman氏:AIの力が証明されるにつれて、仕事に関するリスクが生じる

OpenAIのCEOであるSam Altmanは、特に彼の作品であるChatGPTに関するAIの潜在的な危険性について公言してきました。最近のイ...

人工知能

ピーター・マッキー、Sonarの開発者担当責任者-インタビューシリーズ

ピーター・マッキーはSonarのDeveloper Relationsの責任者です Sonarは、悪いコードの1兆ドルの課題を解決するプラットフォー...