新しいNVIDIA GPUベースのAmazon EC2インスタンスを3つ紹介します

新たなNVIDIA GPUベースのAmazon EC2インスタンス3種類を紹介します

Amazon Elastic Compute Cloud(Amazon EC2)は、人工知能(AI)、機械学習(ML)、グラフィックス、高性能コンピューティング(HPC)のワークロードをパワーするためのアクセラレータの最も幅広い選択肢を提供しています。私たちは、このポートフォリオを最新のNVIDIA GPUを搭載した3つの新しいインスタンスで拡張することを発表することを喜んでいます:NVIDIA H200 GPUを搭載したAmazon EC2 P5eインスタンス、NVIDIA L4 GPUを搭載したAmazon EC2 G6インスタンス、およびNVIDIA L40S GPUを搭載したAmazon EC2 G6eインスタンス。これらの3つのインスタンスは2024年に提供される予定であり、あなたがそれらをどのように活用するかを楽しみにしています。

AWSとNVIDIAは13年以上にわたり協力し、開発者と企業向けに大規模かつ高性能でコスト効果の高いGPUベースのソリューションの先駆者となってきました。私たちは、NVIDIAのパワフルなGPUをAWS Nitro System、3200 GbpsのElastic Fabric Adapter(EFA)v2ネットワーキング、Amazon FSx for Lustreの数百GB/sのデータスループット、Amazon EC2 UltraClustersによるエクサスケールコンピューティングなどのAWSの差別化技術と組み合わせ、AI/ML、グラフィックス、HPCのための最も高性能なインフラストラクチャを提供しています。また、AWS Nitro SystemElastic Fabric Adapter(EFA)v2ネットワーキング、Amazon FSx for Lustre、Amazon EC2 UltraClustersなどのAWSの差別化技術と組み合わせ、AI/ML、グラフィックス、HPCのための最も高性能なインフラストラクチャを提供しています。さらに、Amazon BedrockAmazon SageMaker、およびAmazon Elastic Kubernetes Service(Amazon EKS)などの他のマネージドサービスと組み合わせることで、これらのインスタンスは生成AI、HPC、およびグラフィックスアプリケーションを構築および展開するための業界最高のプラットフォームを開発者に提供します。

AI、HPC、およびグラフィックスワークロード用の高性能かつコスト効果の高いGPUベースのインスタンス

最大の大規模言語モデル(LLM)の開発、トレーニング、推論にパワーを供給するために、EC2 P5eインスタンスにはNVIDIAの最新のH200 GPUが搭載されます。このH200 GPUには141 GBのHBM3e GPUメモリがあり、H100 GPUよりも1.7倍大きく、1.4倍高速です。このGPUメモリの向上とAWS Nitro Systemによって可能になる3200 GbpsまでのEFAネットワーキングにより、AWS上での先端モデルの構築、トレーニング、展開を続けることができます。

NVIDIA L40S GPUを搭載したEC2 G6eインスタンスは、一般に使用可能なLLMのトレーニングと推論だけでなく、Small Language Models(SLM)の利用の拡大をサポートするために構築されています。また、NVIDIA Omniverseを使用して3Dツールとアプリケーション全体で説明とシミュレーションを行い、産業デジタル化のための仮想世界と高度なワークフローを作成するデジタルツインアプリケーションにも最適です。

NVIDIA L4 GPU搭載のEC2 G6インスタンスは、自然言語処理、言語翻訳、ビデオおよび画像解析、音声認識、個別化などのMLモデルの展開に最適な低コストかつエネルギー効率の高いソリューションを提供します。また、リアルタイムでシネマクオリティのグラフィックスやゲームストリーミングの作成およびレンダリングなど、グラフィックスワークロードにも適しています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

データサイエンス

感情AIの科学:アルゴリズムとデータ分析の背後にあるもの

「エモーションAIは、高度なアルゴリズムを使用して、顔と声のデータから感情を解読し、データの偏りやプライバシーに関する...

AIニュース

AIがオンエア中:世界初のRJボット、アシュリーに会おう

オレゴン州ポートランドに拠点を置く人気ラジオ局、Live 95.5は、Futuri MediaのRadioGPTテクノロジーによって動かされる世界...

機械学習

この AI ペーパーでは、X-Raydar を発表します:画期的なオープンソースの深層ニューラルネットワークによる胸部 X 線異常検出

“` イギリスの様々な大学の研究者たちは、豊富なデータセットを用いて、総合的な胸部X線異常検出のためのオープンソー...

機械学習

「ディープラーニングを用いたナノアレイの開発:特定の構造色を生み出すことができるナノホールアレイを設計する新しいAI手法」

色の多様性は、2つ以上の色の組み合わせによってさらに増加します。光は微細なナノ構造と相互作用し、複数の色の固有のパター...

機械学習

「Declarai、FastAPI、およびStreamlitを使用してLLMチャットアプリケーションを展開する」

2022年10月、私が大規模言語モデル(LLM)の実験を始めたとき、最初の傾向はテキストの補完、分類、NER、およびその他のNLP関...

AI研究

このAI研究レビューでは、衛星画像とディープラーニングの統合による資産ベースの貧困の測定について探求しています

ルンド大学とハルムスタッド大学の研究者は、衛星画像と深層機械学習による貧困推定の説明可能なAIに関するレビューを実施し...