新しいNVIDIA GPUベースのAmazon EC2インスタンスを3つ紹介します

新たなNVIDIA GPUベースのAmazon EC2インスタンス3種類を紹介します

Amazon Elastic Compute Cloud(Amazon EC2)は、人工知能(AI)、機械学習(ML)、グラフィックス、高性能コンピューティング(HPC)のワークロードをパワーするためのアクセラレータの最も幅広い選択肢を提供しています。私たちは、このポートフォリオを最新のNVIDIA GPUを搭載した3つの新しいインスタンスで拡張することを発表することを喜んでいます:NVIDIA H200 GPUを搭載したAmazon EC2 P5eインスタンス、NVIDIA L4 GPUを搭載したAmazon EC2 G6インスタンス、およびNVIDIA L40S GPUを搭載したAmazon EC2 G6eインスタンス。これらの3つのインスタンスは2024年に提供される予定であり、あなたがそれらをどのように活用するかを楽しみにしています。

AWSとNVIDIAは13年以上にわたり協力し、開発者と企業向けに大規模かつ高性能でコスト効果の高いGPUベースのソリューションの先駆者となってきました。私たちは、NVIDIAのパワフルなGPUをAWS Nitro System、3200 GbpsのElastic Fabric Adapter(EFA)v2ネットワーキング、Amazon FSx for Lustreの数百GB/sのデータスループット、Amazon EC2 UltraClustersによるエクサスケールコンピューティングなどのAWSの差別化技術と組み合わせ、AI/ML、グラフィックス、HPCのための最も高性能なインフラストラクチャを提供しています。また、AWS Nitro SystemElastic Fabric Adapter(EFA)v2ネットワーキング、Amazon FSx for Lustre、Amazon EC2 UltraClustersなどのAWSの差別化技術と組み合わせ、AI/ML、グラフィックス、HPCのための最も高性能なインフラストラクチャを提供しています。さらに、Amazon BedrockAmazon SageMaker、およびAmazon Elastic Kubernetes Service(Amazon EKS)などの他のマネージドサービスと組み合わせることで、これらのインスタンスは生成AI、HPC、およびグラフィックスアプリケーションを構築および展開するための業界最高のプラットフォームを開発者に提供します。

AI、HPC、およびグラフィックスワークロード用の高性能かつコスト効果の高いGPUベースのインスタンス

最大の大規模言語モデル(LLM)の開発、トレーニング、推論にパワーを供給するために、EC2 P5eインスタンスにはNVIDIAの最新のH200 GPUが搭載されます。このH200 GPUには141 GBのHBM3e GPUメモリがあり、H100 GPUよりも1.7倍大きく、1.4倍高速です。このGPUメモリの向上とAWS Nitro Systemによって可能になる3200 GbpsまでのEFAネットワーキングにより、AWS上での先端モデルの構築、トレーニング、展開を続けることができます。

NVIDIA L40S GPUを搭載したEC2 G6eインスタンスは、一般に使用可能なLLMのトレーニングと推論だけでなく、Small Language Models(SLM)の利用の拡大をサポートするために構築されています。また、NVIDIA Omniverseを使用して3Dツールとアプリケーション全体で説明とシミュレーションを行い、産業デジタル化のための仮想世界と高度なワークフローを作成するデジタルツインアプリケーションにも最適です。

NVIDIA L4 GPU搭載のEC2 G6インスタンスは、自然言語処理、言語翻訳、ビデオおよび画像解析、音声認識、個別化などのMLモデルの展開に最適な低コストかつエネルギー効率の高いソリューションを提供します。また、リアルタイムでシネマクオリティのグラフィックスやゲームストリーミングの作成およびレンダリングなど、グラフィックスワークロードにも適しています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AIニュース

創造性とAIに関するレフィク・アナドールとの対話

Mira Lane は、先駆的なアーティスト Refik Anadol と共に、AIが創造力を強化している方法を探求しています

AIニュース

「チャンドラヤーン3の着陸:AIとセンサーがISROの壮大な月探査を支援」

宇宙探査の魅惑的な広がりの中で、すべてのミッションは未知へのサイコロのような賭けです。インドの国立宇宙機関であるイン...

AIニュース

エロン・マスクのxAIがOpenAIのChatGPTに挑戦します

ビジョン溢れる億万長者であるイーロン・マスクは、電気自動車、宇宙探査、ソーシャルメディアなどの事業を手掛ける人物で、...

データサイエンス

「AIベースのサイバーセキュリティがビジネスの強靭性を高める方法」

世界の50億人以上のインターネットユーザーとおよそ540億個のデバイスが、IDCによると1秒あたり3.4ペタバイトのデータを生成...

AI研究

「Googleの研究者が球面上でのディープラーニングのためのJAX向けのオープンソースライブラリを紹介します」

ディープラーニングは、入力から複雑な表現を自動的に学習する機械学習の一部です。その応用は、言語処理のための画像と音声...

データサイエンス

Rendered.aiは、合成データの生成にNVIDIA Omniverseを統合します

Rendered.aiは、プラットフォームとして提供される合成データ生成(SDG)により、開発者、データサイエンティスト、その他の...