「Google Sheetsにおける探索的データ分析」

Google Sheetsの探索的データ分析

Google SheetsとPandasのアプローチの比較

著者によって生成された画像

PandasやJupyterのようなモダンなツールを使ってデータを処理するのはいつも素敵です。しかし、同僚や友人からデータ分析を頼まれた場合を想像してみましょう。彼らはテクニカルな人ではなく、PythonやJupyterを使わず、TableauやPower BIなどの高度な(ただし無料ではない)サービスのアカウントも持っていないかもしれません。このような場合、Google Sheetsを使用してデータを処理することは、いくつかの理由から良い回避策となるでしょう:

  • Googleは世界中で利用されています。この記事が書かれている時点で、18億人以上のユーザーがGoogleアカウントを持っています。現在ではほぼ誰もがGoogleアカウントを持っており、ドキュメントの共有は非常に簡単です。
  • Googleのエコシステムは安全で安心です。二要素認証や最新のセキュリティ基準をサポートしており、プライベートなデータセットも限られたグループ間で共有することができます。
  • 最後になりますが、このソリューションは無料であり、追加の費用は必要ありません。そしてボーナスとして、Google Sheetsはブラウザで動作し、ソフトウェアのインストールを必要とせず、Windows、Linux、OSX、さらにはスマートフォンなど、どのプラットフォームでも動作します。

この記事では、まずPandasで基本的な探索的データ分析を行い、その後Google Sheetsでも同じプロセスを繰り返し、その動作を確認します。

データソース

もっと楽しくするために、実際のデータセットを使用しましょう。太陽光パネルによって生成されるエネルギーを計算するためのツールを作成します。そのために、PVGIS(欧州委員会フォトボルタイック地理情報システム)のデータを使用します。このデータは、このURL(CC BY 4.0ライセンス)から無料でアクセスできます:

PVGISインターフェース、著者による画像

このページを使用すると、さまざまな年や場所の毎時データを選択することができ、太陽光照射データをダウンロードしてエネルギー発電を計算することができます。スクリーンショットで見ることができるように、データをダウンロードした後、Pandasで使用することができます。

Pandasでの探索的データ分析(EDA)

まず、Pandasで探索的データ分析(EDA)を始めましょう。いつもなら簡単ですが…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more