Seabornを使用してパンチカードプロットを作成する
Seabornでパンチカードプロットを作成する
周期的なトレンドを素早く特定する
パンチカードプロット、またはテーブルバブルチャートは、データの周期的なトレンドを強調するための視覚化の一種です。通常、曜日と時間に対する、剛性のある行列またはグリッド形式でデータを表示します。円は行と列の交差点のデータポイントを表し、そのサイズがデータの値を示します。色は追加情報を含めるために使用できます。
「パンチカード」という名前は、かつて労働者が自分の出勤や退勤を記録するためにマシンにスタンプまたは「パンチ」する「タイムカード」を指しています。
パンチカードプロットを作成するには、タイムスタンプ付きのデータが必要です。このクイックサクセスデータサイエンスプロジェクトでは、ワシントンD.C.で自転車が借りられる時刻を追跡するためにKaggleのデータセットを使用します。
データセット
KaggleのワシントンD.C.自転車シェアリングデータセットには、ワシントンD.C.のCapital bikeshareシステムで2011年と2012年に借りられた自転車の数が、毎時および毎日で記録されています[1]。このデータはCC0 1.0ライセンスで公開されています。データセットの内容についての詳細は、readmeファイルを参照してください。
便宜上、このデータはすでにパブリックなGistにダウンロードされています。
ライブラリのインストール
Pythonに加えて、データ解析ライブラリのpandasとプロットライブラリのseabornが必要です。以下のコマンドでインストールできます:
conda install pandas seaborn
または
pip install pandas seaborn
コード
以下のコメント付きコードはJupyterLabで書かれ、セルごとに説明されています。
ライブラリのインポートとデータの読み込み
プロットのためにmatplotlibとseaborn、データ解析のためにpandasをインポートした後、レンタルデータのCSVファイルをpandasのDataFrameに読み込みます。年の季節、曜日、時間、借りられた数(貸出回数)の列のみを保持します。
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles