チャートを使ったストーリーテリング

Using charts for storytelling.

パート4(II):構成を表示しますか?

Jonatan Pieによる写真、Unsplash

これは、データの構成を表示するための最適なデータ可視化技術を示すことが目的とされている4番目の記事の2番目のパートです。

この記事の内容をより良く理解するために、前回の記事で「構成」の概念とその要素のいくつかが説明されているので、それを読む(または再読する)ことを強くお勧めします。

前の記事では、以下の6つのグラフが構成を表示するために最も一般的に使用されることを示しました:円グラフ、積み上げ棒グラフ、トリーマップ、積み上げ面グラフ、ウォーターフォールグラフ、マリメッコグラフ。

リストの最初の3つはその記事で詳しく説明されています。今回はリストの最後の3つに焦点を当てます(積み上げ面グラフ、マリメッコグラフ、ウォーターフォールグラフ)。

積み上げ面グラフ

まず、面グラフとは何かを定義しましょう:データポイントを結ぶ線と水平軸の間のエリアが特定の色で塗りつぶされたラインチャートの一種です。

面グラフには4つの異なるタイプがあります:1)標準の面グラフ、2)積み上げ面グラフ、3)パーセント積み上げ面グラフ、4)重なり面グラフ。構成を表示するためには、積み上げ面グラフ(StAC)とパーセント積み上げ面グラフ(%StAC)のみが使用されます。

積み上げ面グラフでは、複数のエリアが重ねて表示されます。数値変数の進化(動的な構成)を時間の経過とともに表示し、構成を示すために通常はカテゴリが使用されます。

積み上げ面グラフに関連するのは部分から全体へのチャートであり、各エリアはカテゴリの合計に対する各部分の絶対値を示します。パーセント積み上げ面グラフに関連するのも同様で、各エリアはカテゴリの合計に対する各部分のパーセンテージを示します。 異なるエリア間には重なりはありません。積み上げ面グラフでは、垂直軸の最終の高さは、表されるすべての数値の合計に関連しています。パーセント積み上げ面グラフでは、垂直軸の最終の高さは常に100%です。

図1は、2013年から2018年の4つの異なる地域でのPS4の販売を表す積み上げ面グラフです。グラフの右上隅に表示されている凡例は、異なる色のエリアがどの地域に属しているかを示しています。各地域(各エリア、各部分)が総販売(全体、販売の合計)にどのように貢献しているかがわかります。各エリアの高さは、各地域の販売の絶対値を表し、最終の高さはそれらの値の合計を示して年ごとの総販売を示しています。積み上げ面グラフは、各部分の正確な数値を表示することに関心を持たずに、全体の傾向と各部分の相対的な貢献を伝えるために主に使用されるべきです。

図1:積み上げ面グラフ。Plotly Expressによるグラフ

図2は、同じPS4の販売データを表す%StACです。各エリアは、各地域の総グローバルPS4販売に対する割合を表しています。上記のように、最終の高さは100%です。間違いなく、このタイプのグラフは、図1に表示されるものよりも世界的な販売の構成の分析に優れています。

図2:パーセント積み上げ面グラフ。Plotly Expressによるグラフ

最終警告: StAC(スタックエリアチャート)と%StACは、数値情報を比較することによってスタックされた領域を解読する観客の能力に依存しているため、読み取りや理解が比較的困難です。これらは、グローバルなトレンドや各パートの相対的な貢献を伝えるためにのみ使用することをお勧めします。

マリメッコチャート

マリメッコチャート(MC)は、特定のタイプの可変幅棒グラフです。マリメッコチャートは100%スタック棒グラフに似ていますが、矩形の棒の幅が異なる点が異なります。

MCは、データセットに存在する各カテゴリのために2つの数値変数を表示するために使用されます。2つの軸があります。垂直軸は100%の数値スケールを持ち、水平軸はカテゴリまたは数値のいずれかになります。矩形の棒は垂直方向に配置され、間にスペースはありません。水平軸の全幅が占有されます。

図3はマリメッコチャートを表示しています。このチャートは、ブランドと地域ごとの年間収益を示しています。パーセンテージの垂直軸は地域ごとの割合を示し、水平軸はブランドごとの年間収益を示しています。1つのチャートで各カテゴリとサブカテゴリの2つの数値を示しています。

図3: マリメッコチャート。Vizzloの許可を得て作成されました(#1)

以前に述べたように、「マリメッコチャートを特徴づける要素は次のとおりです:異なる幅の小さな長方形に分割された長方形領域;垂直に積み重ねられた長方形;チャート全体の幅を占有する水平軸;パーセントスケールを持つ垂直軸;ブランドごとの総収益が上部ベースラインに表示される;異なる棒の幅により、各ブランドの総収益への相対的な貢献を計算することが可能」と述べています。

マリメッコチャートは、100%スタックされた棒グラフの代替として使用できますが、静的な分析(ある時点での構成を表示するため)にのみ使用する必要があります。構成の変化を時間の経過に沿って表示するためには、決して使用しないでください。

スタックエリアチャートと同様の警告:MCは解釈が困難であり、特に多数の長方形がある場合には、人間は面積を計算するのが得意ではありません。

ウォーターフォールチャート

ウォーターフォールチャート(WC)は、データの追加と減算の間で変動するデータの累積効果を表す特定の種類の棒グラフです。そのメッセージは、2つのデータポイント間の構成変化を伝えることです。

WCは、初期の垂直バー、一連の中間垂直バー、および最終の垂直バーで構成されています。通常(および推奨される)のレイアウトは、初期と最終の垂直バー(列)が同じ色であり、中間バー(フローティングバー)が追加の場合は緑の値、減算の場合は赤の値を示すことです。最初と最後の列がゼロの基準線から始まるのも一般的です。

図4は、上記で示されている特性を持つカテゴリベースのウォーターフォールチャートを示しています。このタイプのWCは、人事(特定の部門の採用と離職を示す)、特定のビジネス(収入と費用を示す)、倉庫(追加された在庫、取られた在庫)、およびデータが正の値から負の値に変動する場合など、多くの他の状況で使用されます。時間ベースのWCは、金融業界で使用されます(単一の期間を通じた利益と損失を示す)。

図4: Plotlyで作成されたカテゴリベースのウォーターフォールチャート

WCは、標準の棒グラフよりも豊富なコンテキスト情報を提供します。後者は初期値と最終値のみを表示しますが、前者は追加と減算の要素の寄与と、初期値と最終値の間の変化の構成を示します。

初期値と最終値の間の変化のストーリーを伝えるというこの注目すべき能力は、連続する追加と減算の特定のサイズを比較することが困難なフローティングカラムの共通の基準がないため、変化の大きさを正しく解釈することが難しいという特性と相反しています。最良の方法は、列に数値の注釈を追加し、それらを水平線で接続することです(図4&図5)。

図5は、架空のウェブページの月間訪問者数の変化を表す時間ベースのウォーターフォールチャートを示しています。この特定の状況を一般の観客が理解するためには、他の視覚的な表現方法はより複雑です。

図5:Plotlyで作成された時間ベースのウォーターフォールチャート、作者作成

結論

データ可視化プロジェクトにおける重要な問題は「自分のストーリーを伝えるために適切なチャートを選んだか?」ということです。

最も適切なチャートの選択は、伝えるメッセージの性質に依存します。

組成が伝えるメッセージである場合、以下の6つの異なるタイプのチャートが使用されます:円グラフ、積み上げ棒グラフ、Treemaps、積み上げ面グラフ、ウォーターフォールチャート、Marimekkoチャート。

私たちの推奨は、静的な組成には円グラフを、動的な組成には積み上げ棒グラフを使用することです。Treemapsは、全体が10個または何千個のパーツで構成されている場合に有効な代替手段です。Marimekkoチャートは、主要なカテゴリとそのサブカテゴリを含む2つの数値変数を表すのに適しています。最後に、ウォーターフォールチャートは最初の値と最終値の変化の組成のみを表示します。

この記事が興味深いと思った場合、私の56の前の記事のいずれかをお読みください:https://medium.com/@dar.wtz 。 データ可視化、シミュレーション、モンテカルロ法、ダッシュボードなどに関する300,000以上の閲覧回数。

#1:https://vizzlo.com/

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more