新しいNVIDIA GPUベースのAmazon EC2インスタンスを3つ紹介します

新たなNVIDIA GPUベースのAmazon EC2インスタンス3種類を紹介します

Amazon Elastic Compute Cloud（Amazon EC2）は、人工知能（AI）、機械学習（ML）、グラフィックス、高性能コンピューティング（HPC）のワークロードをパワーするためのアクセラレータの最も幅広い選択肢を提供しています。私たちは、このポートフォリオを最新のNVIDIA GPUを搭載した3つの新しいインスタンスで拡張することを発表することを喜んでいます：NVIDIA H200 GPUを搭載したAmazon EC2 P5eインスタンス、NVIDIA L4 GPUを搭載したAmazon EC2 G6インスタンス、およびNVIDIA L40S GPUを搭載したAmazon EC2 G6eインスタンス。これらの3つのインスタンスは2024年に提供される予定であり、あなたがそれらをどのように活用するかを楽しみにしています。

AWSとNVIDIAは13年以上にわたり協力し、開発者と企業向けに大規模かつ高性能でコスト効果の高いGPUベースのソリューションの先駆者となってきました。私たちは、NVIDIAのパワフルなGPUをAWS Nitro System、3200 GbpsのElastic Fabric Adapter（EFA）v2ネットワーキング、Amazon FSx for Lustreの数百GB/sのデータスループット、Amazon EC2 UltraClustersによるエクサスケールコンピューティングなどのAWSの差別化技術と組み合わせ、AI/ML、グラフィックス、HPCのための最も高性能なインフラストラクチャを提供しています。また、AWS Nitro System、Elastic Fabric Adapter（EFA）v2ネットワーキング、Amazon FSx for Lustre、Amazon EC2 UltraClustersなどのAWSの差別化技術と組み合わせ、AI/ML、グラフィックス、HPCのための最も高性能なインフラストラクチャを提供しています。さらに、Amazon Bedrock、Amazon SageMaker、およびAmazon Elastic Kubernetes Service（Amazon EKS）などの他のマネージドサービスと組み合わせることで、これらのインスタンスは生成AI、HPC、およびグラフィックスアプリケーションを構築および展開するための業界最高のプラットフォームを開発者に提供します。

AI、HPC、およびグラフィックスワークロード用の高性能かつコスト効果の高いGPUベースのインスタンス

最大の大規模言語モデル（LLM）の開発、トレーニング、推論にパワーを供給するために、EC2 P5eインスタンスにはNVIDIAの最新のH200 GPUが搭載されます。このH200 GPUには141 GBのHBM3e GPUメモリがあり、H100 GPUよりも1.7倍大きく、1.4倍高速です。このGPUメモリの向上とAWS Nitro Systemによって可能になる3200 GbpsまでのEFAネットワーキングにより、AWS上での先端モデルの構築、トレーニング、展開を続けることができます。

NVIDIA L40S GPUを搭載したEC2 G6eインスタンスは、一般に使用可能なLLMのトレーニングと推論だけでなく、Small Language Models（SLM）の利用の拡大をサポートするために構築されています。また、NVIDIA Omniverseを使用して3Dツールとアプリケーション全体で説明とシミュレーションを行い、産業デジタル化のための仮想世界と高度なワークフローを作成するデジタルツインアプリケーションにも最適です。

NVIDIA L4 GPU搭載のEC2 G6インスタンスは、自然言語処理、言語翻訳、ビデオおよび画像解析、音声認識、個別化などのMLモデルの展開に最適な低コストかつエネルギー効率の高いソリューションを提供します。また、リアルタイムでシネマクオリティのグラフィックスやゲームストリーミングの作成およびレンダリングなど、グラフィックスワークロードにも適しています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Amazon EC2Announcements

Was this article helpful?

93 out of 132 found this helpful

新しいNVIDIA GPUベースのAmazon EC2インスタンスを3つ紹介します

AI、HPC、およびグラフィックスワークロード用の高性能かつコスト効果の高いGPUベースのインスタンス

Was this article helpful?

「前方予測デコーディング」：LLM推論を加速するための並列デコーディングアルゴリズム

クラウドファーストデータサイエンス：データの分析とモデリングのための現代的なアプローチ

機械学習

「NotebookLMは12以上の新機能を追加します」

DeepMindのAIマスターゲーマー：2時間で26のゲームを学習

「バリー・ディラー対生成AI：著作権法的な戦い」

あなたが作るものはあなたそのものです：コードをより人間的にする方法

AutoML - 機械学習モデルを構築するための No Code ソリューション

OpenAIを使用してカスタムチャットボットを開発する