アナリティクスエンジニアリングへの紹介

美容とファッションに関する記事を活気溢れる形で執筆する、美容とファッションの専門家です

分析エンジニアとは何者であり、彼らは何をするべきなのか

DALL-E2によって生成されたイメージ

従来、データチームはデータエンジニアとデータアナリストによって形成されていました。

データエンジニアは、データ処理をサポートするためのインフラストラクチャの構築を担当しています。これには、データベースの設定や外部ソースからデータを取り込んで別のシステム(おそらく別のデータベース)に格納するためのETLプロセスの実装が含まれます。さらに、データエンジニアは通常、データの整合性、新鮮さ、セキュリティを確保する責任を担当し、その後アナリストがデータをクエリできるようにします。データエンジニアの典型的なスキルセットには、Python(またはJava)、SQL、オーケストレーション(Apache Airflowなどのツールを使用)、およびデータモデリングが含まれます。

一方、データアナリストは、内部ユーザーや部門にビジネスの洞察を提供するために、ExcelやSQLを使用してダッシュボードやレポートを作成する役割を担当します。

データチームの従来の構成

ETLからELTへの移行

データを処理し価値ある洞察を得るためには、まず抽出する必要がありますよね? 🤯

データの取り込みはETL(最近ではELTも)プロセスを使用して行われます。ETLとELTのパラダイムの両方には、3つの主要なステップ、抽出(Extract)、変換(Transform)、ロード(Load)が含まれます。今のところ、これらのステップの実行順序を無視し、各ステップが独立して何を行うかに焦点を当てましょう。

抽出

このステップは、永続的なソースからデータを取り込むプロセスを指します。このデータソースは、データベース、APIエンドポイント、ファイル、またはメッセージキューなどが該当します。

抽出ステップはさまざまなソースからデータを取り込みます — 出典:著者

変換

変換ステップでは、パイプラインが特定の目標を達成するために、データの構造や形式にいくつかの変更を加えることが期待されます。変換には、変更(例:「アメリカ合衆国」を「US」にマッピングする)、属性の選択、数値計算、または結合などが含まれることがあります。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more