「緑を守る:加速されたアナリティクスがコストと炭素排出を削減する」
Green Protection Accelerated Analytics Reducing Costs and Carbon Emissions
企業は、加速されたコンピューティングが収益向上に貢献するだけでなく、地球にポジティブな影響を与えることを発見しています。
NVIDIA RAPIDS Accelerator for Apache Sparkは、データ分析を高速化するソフトウェアであり、パフォーマンスを向上させ、コストを削減するだけでなく、エネルギー効率も向上させます。つまり、二酸化炭素などの温室効果ガスのネットゼロ排出目標を達成するのに役立ちます。
新しいベンチマークによると、RAPIDS Acceleratorは、平均5倍の高速化と4倍のコンピューティングコスト削減を実現する一方で、企業の炭素フットプリントを最大80%削減することができます。
それは多くの人々が享受できる大きな成果です。フォーチュン500のうち80%を含む数千の企業が、急増するデータを分析するためにApache Sparkを使用しています。
- 「Rを使った南アメリカのマッピング:ジオビジュアライゼーションの詳細解説」
- 「MLOpsは過学習していますその理由をここで説明します」
- 「リアルタイムデータのためのPythonでのChatGPT APIの使用方法」
実際、すべてのApache SparkユーザーがRAPIDS Acceleratorを採用した場合、年間で合計7.8メートリックトンの二酸化炭素排出削減が可能になります。これは、ガソリン878ガロン分の車の排出量に相当します。これは、環境に優しいコンピューティングが気候変動との闘いを前進させる素晴らしい例です。
人類にとっての課題
国連によると、70以上の国が温室効果ガスのネットゼロ目標を設定しています。ネットゼロへの移行は、「人類が直面している最も大きな課題の1つ」と説明されています。
企業もこの取り組みに積極的に取り組んでいます。
たとえば、NVIDIAは大手金融サービス企業と協力して、リアルタイムの詐欺防止のためにApache Sparkをテストしています。同社は、加速されたコンピューティングによって炭素フットプリントを削減し、ネットゼロ銀行アライアンスなどのグループとの調整を図ることを目指しています。
世界最大のAIスーパーコンピュータは、加速されたコンピューティングのエネルギー効率を2023年5月に検証しました。
ローレンス・バークレー国立研究所のPerlmutterシステムは、人気のある4つの科学アプリケーション全体で、NVIDIA A100 Tensor Core GPUによるエネルギー効率の向上率が平均5倍であることを報告しました。気象予報用のアプリケーションでは、CPUと比較して9.8倍の高速化が実現しました。
AT&TがRAPIDS Acceleratorを採用
AT&T、Adobe、内国歳入庁などの組織は、すでにRAPIDS Acceleratorのパフォーマンスとコスト効果の利点を見つけています。
昨年のテストでは、AT&Tは1か月分のモバイルデータ(2.8兆行の情報)をわずか5時間で処理しました。これは、以前のテストと比較して、60%の低コストで3.3倍高速です。
「これは驚きの瞬間でした。CPUクラスタでは、データの処理に48時間以上かかりましたが、過去にはデータがあったにもかかわらず、処理に非常に長い時間がかかったため、使用することができませんでした」と、AT&TのAIアーキテクトであるAbhay Dabholkarはブログで述べています。
また、「ジョブが時間がかかりすぎてデータが多い場合は、GPUをオンにすることをお勧めします。Sparkでは、CPUで実行されるコードと同じコードがGPUで実行されます」とも彼は付け加えました。
Adobeがサービスを高速化
Adobeは、マーケティングチームがAIを活用して分析を高速化するIntelligent Servicesプラットフォームで加速されたコンピューティングを使用しました。
それにより、RAPIDS Acceleratorを使用した単一のNVIDIA GPUノードが16ノードのCPUクラスタを33%上回りながら、計算コストを70%削減することがわかりました。
別のテストでは、GPUで加速されたRAPIDSライブラリがAIモデルのトレーニングを7倍高速化し、CPUで同じジョブを実行するコストを90%節約しました。
「これは素晴らしいコスト削減と高速化です」と、Adobeの機械学習エンジニアであるLei Zhangは、GTCでの講演で述べています(登録が必要です)。
Sparkでの20倍の高速化
IRSは、分析するために必要な3テラバイト以上のデータセットを処理するのに十分なパワフルなCPUがありませんでしたので、IRSはRAPIDS Acceleratorを活用しました。
GPUパワードサーバーのSparkクラスタが負荷を処理し、さらに大きなデータセットに対処できるようになりました。
「現在、この統合を実装しており、データエンジニアリングとデータサイエンスのワークフローにおいて、20倍以上の高速化とコスト半減を実現しています」と、IRSの研究・応用アナリティクス・統計部門の技術支店長であるJoe Ansaldiはブログで述べています。
はじめ方
パフォーマンスの高速化とコスト削減は、ワークロードによって異なります。そのため、NVIDIAは高速化されたSpark分析ツールを提供しています。
このツールは、ユーザーがコードの変更なしでRAPIDSアクセラレータがアプリケーションにどのような効果をもたらすかを示します。また、ユーザーがGPUアクセラレーションを調整してワークロードで最高の結果を得るのを支援します。
RAPIDSアクセラレータが収益を向上させている場合、企業は省エネの計算を行い、地球を保護するための進捗状況を報告することができます。
このソリューション概要で詳細をご覧ください。また、以下のビデオをご覧いただき、Cloudera Data PlatformがRAPIDSアクセラレータ for Apache Sparkで44倍の高速化を実現した様子をご覧ください。
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles