「最も難しいPandas:ピボットテーブル、スタック、およびアンスタックを明確に説明する」
Explaining the most difficult aspects of Pandas pivot tables, stack, and unstack.
これまでにないほどこれらの難問をマスターしましょう
紹介
ほとんどのPandasの式は英語のように読むことができますが、時々本当の難問に直面します。はい、それらはcut
やpivot
などという直感的な名前を持っていますが、それらは頭を抱えるのがほとんど不可能です。
そこで、私はPandasの中で最も難しい関数と考えるものについての一連の記事を書くことにしました。この記事では、pivot_table
、stack
、unstack
の3つを明確に説明します。
さあ、始めましょう。
セットアップ
Pandasのpivot_table()、groupby()との比較
それを行うための一つの明らかな方法があるべきです。
上記はPythonのZenからの引用です。Pythonでは、一つの問題に対して一つの明らかな解決策があることを望んでいます。しかし、pandas
は故意にこれを避けています。pandas
では、一つの操作に対して複数の方法があることがよくあります。
pivot_table()
はその例です。これはgroupby()
関数と完全で、場合によってはより良い代替です。違いは結果の形状です。groupby()
はSeries
オブジェクトを返しますが、pivot_table()
は使いやすいデータフレームを提供します。
両方の関数を使用して問題を解決してみましょう。まず、seaborn
からtips
データセットを読み込みます:
tips = sns.load_dataset('tips')tips.head()
私たちは、各性別の全請求額の合計を求めたいと思います:
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles