「データエンジニアリングの本」

『美容とファッションの世界〜魅力とトレンドを解き明かす』

データエンジニアリングを徐々に学ぶ読者のための要約

Tamas Papによる写真、Unsplashで使用

この記事では、データエンジニアリング(DE)を学ぶ方々に興味深いであろうデータエンジニアリングの本やリソースについて話したいと思います。データエンジニアリングを概念的に全体的に説明する市場にはほとんどありませんでした。そのうちのいくつかは特定のツールの使用方法やデータプラットフォームのアーキテクチャに関して優れているものもありますし、私のお気に入りの就寝時の読書には非常に眠くなるくらい退屈なものもあります。戦略的な意思決定に適しているものややや時代遅れのものでもまだ有用なものもあります。興味深く読んでいただければ嬉しいです。

開示: この記事にはアフィリエイトリンクが含まれている場合があります。つまり、私のリンクから購入を決めていただいた場合、費用はかかりませんが、私に手数料が支払われます。

1. Pythonによるデータエンジニアリング

Pythonを使って巨大なデータセットを扱い、データモデルを設計し、データパイプラインを自動化するPaul Crickard, 2020

データエンジニアリングにおいてオープンソースのApacheツールを学びたい方には、この本がおすすめです。データモデリングなど、すべての基本的なデータエンジニアリングのトピックをカバーしており、最も一般的なデータの変換の例が豊富に提供されています。本の説明にもあるように、Pythonとデータモデリングにフォーカスしており、Pythonのツールを使用してデータセットを抽出、クレンジング、エンリッチメントするためのETL技術に重点を置いています。Apache KafkaとApache Sparkの詳細な説明だけでなく、ファイル形式、データの変換とクレンジングに必要な基本もカバーしています。この本では、データパイプラインの展開やデータ環境での作業についても非常に良い視点を提供しています。

この本と合わせて高度なETL技術に関する私のエピソードの一つ:

データエンジニアのためのPython

初心者向けの高度なETL技術

towardsdatascience.com

2. データエンジニアリングの基礎

Joe Reis, Matt Housley著
出版日: 2022年6月
出版社: O’Reilly Media, Inc.

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more