パンダのカット対qcutが明確に説明されています(ついに)
「パンダのカットとQカットの違いを明確に解説(ついに)」
pandasでデータをカスタムにビン分割する方法
動機
「これは一体何?」
初心者がある難しいpandas
の機能の出力を見ると、よくこんな反応をします。チュートリアルやコースでは、一文でそのような機能を紹介し、すぐに他のトピックに移ります。ドキュメントを上から下まで読んでも、1分以上かかりますよ。
初心者の私は、そのような状況にいつもイライラしました。ある時、Udacityのナノ度プログラムでMatplotlibのヒートマップについて学んでいました。ご存知の通り、MatplotlibではSeabornのようにヒートマップに自動で注釈を作成することはできないので、手動で作成する必要がありました。そのためには、データをカテゴリに分割するためにqcut
またはcut
(この記事のテーマです)を使用しますが、私はこれらの関数に完全に初めてでした。
インストラクターは1文で関数を簡潔に「説明」し、ドキュメントへのリンクが画面に表示されました🤦♂️。文法を入力するパートでは早送りで進んでいました。
- 「驚くほど速い、コード不要のPython Foliumマップと素晴らしいGPT-4プロンプト」
- ランダムフォレストモデルの経営概要
- 会話の魔法を解き放つ:ChatGPTをReact.jsとNode.jsと統合する
最近、私は他の人が同じ困難に直面しないように、pandas
の難しい関数を解説するシリーズを少しずつ書いています。これは4回目で、数値データのビン分割についてのものです。ここではqcut
とcut
を使用します。
セットアップ
サンプルデータには、seaborn
の組み込みplanets
データセットを使用します。
>>> planets.describe()
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles