「コードの機能と読みやすさを強化するために、パンダのデータフレームをカスタムメソッドで拡張する方法」

「パンダのデータフレームをカスタムメソッドで拡張して、コードの機能と読みやすさを強化する方法」

pandasデータフレームをカスタムメソッドで拡張するためのステップバイステップガイド。条件付き確率や期待値の拡張方法の完全な例も含まれています。

Markus Spiskeによる写真、Unsplashから

はじめに

問題

pandasのデータフレームには、多くの組み込み関数がありますが、Pythonプログラマーは常にデータを照会したり変換したりするための新しい方法を求めるものです。

機会

一般的なアプローチは、関数を書き、データフレームをパラメータとして渡すことですが、これは複雑になる可能性があります。最適なアプローチは、新しいメソッドやプロパティをpandasクラスに直接追加することです。

進むべき道

pandasや他のライブラリのクラスの機能をカスタムメソッドやプロパティで簡単に拡張できます。これにより、読みやすく理解しやすく再利用可能なコードが生成されます。

背景

私は因果推論のライブラリのコードをいくつか書いており、いくつかの複雑なデータ操作があり、定期的な関数呼び出しでコードが読みづらく理解しづらくなったと感じました。

pandasのデータフレームが私が関数を書いていることを元々ネイティブで行うのであれば、コードは清潔でシンプルで理解しやすくなるというアイデアにたどり着きました。そこからpandasを拡張する方法を見つけ出すまでの小さな飛躍でした…

解決策

最初に実装したかった関数は確率と条件付き確率です。次のデータセットを考えてみましょう…

著者による画像

これは訓練、スキル、収入の関係を捉えた合成データセットで、各行は訓練した(またはしなかった)、スキルを習得した(またはしなかった)、収入を増加させた(またはしなかった)個人を表しています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more