「モダンデータウェアハウス」というテーマ

『モダンデータウェアハウス』の魅力に迫る

最先端のデータプラットフォームデザイン

Nubelson Fernandes氏による写真(Unsplash)

この記事では、他のデータプラットフォームアーキテクチャの種類と比較して、モダンなデータウェアハウス(DWH)の利点について紹介します。現在、DWHはデータエンジニアの間で最も人気のあるプラットフォームだと言えるでしょう。他のソリューションに比べて非常に貴重な利点を提供しますが、一部の既知の制限もあります。データエンジニアリングを学びたいと思っている方には、このストーリーが理解を深めるのに最適な場所かもしれません。アーキテクチャ図の中心に位置するDWHソリューションについて説明します。市場で利用可能なさまざまなDWHでデータを取り込み、変換する方法を見ていきます。経験豊富なユーザーのご意見もお聞かせください。このトピックについてのご意見をお待ちしています。

データウェアハウスの主な特徴

サーバーレスで分散されたSQLエンジン(BigQuery、Snowflake、Redshift、Microsoft Azure Synapse、Teradataなど)は、モダンなデータウェアハウス(DWH)と呼ばれます。これはSQLを最初に考えたデータアーキテクチャ[1]であり、データがデータウェアハウスに格納されるため、デノーマライズされたスタースキーマ[2]のデータセットを使用する利点をすべて活用できます。ほとんどのモダンなデータウェアハウスは分散されてスケーリングが良く、テーブルのキーや索引の心配は必要ありません。ビッグデータに対する適切なアドホック分析クエリに適しています。

データプラットフォームアーキテクチャの種類

ビジネスニーズにどれだけ対応できるか? 選択のジレンマ。

towardsdatascience.com

ほとんどのモダンなデータウェアハウスソリューションは、構造化および非構造化データを処理でき、SQLのスキルがあるデータアナリストにとって非常に便利です。

DWHデータライフサイクル。著者の画像。

モダンなデータウェアハウスは、Looker、Tableau、Sisense、Modeなどのビジネスインテリジェンスソリューションと簡単に統合できます。これらのソリューションはANSI-SQLを使用してデータを処理します。以下の図は、一般的なデータ変換のプロセスと使用されるツールをマッピングしようとしたものです(完全なリストではありません)。以下のように分かります…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more