「Numexprの探索:Pandasの背後にある強力なエンジン」

Numexpr検索:Pandasの強力なエンジン

高速なコンピューティング

PythonのNumexprとPandasのeval/query関数を使用してデータ分析のパフォーマンスを向上させる

Numexprを使用して、最も住みやすい都市を見つけるのを助けてください。 写真クレジット:作者による作成、Canva

この記事では、PythonライブラリであるNumexprについて紹介します。Numexprは、Numpy Arraysの計算パフォーマンスを向上させるツールです。Pandasのevalメソッドとqueryメソッドもこのライブラリをベースにしています。

この記事では、実践的な天気データ分析プロジェクトも取り上げます。

この記事を読むことで、Numexprの原理を理解し、この強力なツールを使用して計算を高速化する方法を学ぶことができます。

イントロダクション

Numpy配列の復習

以前の記事で、Numpy配列についての例を使用して、なぜNumpyのキャッシュ局所性が効率的なのかを説明しました。

PythonのリストとNumPy配列:メモリレイアウトとパフォーマンスの利点についての詳細な調査

割り当ての違いと効率の向上を探る

towardsdatascience.com

図書館に資料を探しに行くたびに、関連する本をいくつか取り出し、デスクのそばに置きます。

これにより、本を読むたびに本棚に走る必要なく、関連する資料を素早く確認できます。

特に多くの関連書籍を参照する必要がある場合、この方法は多くの時間を節約します。

このシナリオでは、本棚がメモリに相当し、デスクがCPUのL1キャッシュに相当し、読者がCPUのコアに相当します。

CPUがRAMにアクセスすると、キャッシュはキャッシュライン全体を高速キャッシュに読み込みます。 作者による画像

Numpyの制約

運悪く、シェイクスピアとトルストイの作品をクロス比較するよう要求される厳しい教授に出くわしたとしましょう。

この時点で、事前に関連する本を取り出すことはうまくいきません。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

データサイエンス

「David Smith、TheVentureCityの最高データオフィサー- インタビューシリーズ」

デビッド・スミス(別名「デビッド・データ」)は、TheVentureCityのチーフデータオフィサーであり、ソフトウェア駆動型のス...

機械学習

「Prolificの機械学習エンジニア兼AIコンサルタント、ノラ・ペトロヴァ – インタビューシリーズ」

『Nora Petrovaは、Prolificの機械学習エンジニア兼AIコンサルタントですProlificは2014年に設立され、既にGoogle、スタンフ...

データサイエンス

「3つの質問:ロボットの認識とマッピングの研磨」

MIT LIDSのLuca CarloneさんとJonathan Howさんは、将来のロボットが環境をどのように知覚し、相互作用するかについて議論し...

人工知能

「スノーケルAIのCEO兼共同創設者、アレックス・ラットナー - インタビューシリーズ」

アレックス・ラトナーは、スタンフォードAIラボを母体とする会社、Snorkel AIのCEO兼共同創設者ですSnorkel AIは、手作業のAI...

人工知能

「Kognitosの創設者兼CEO、ビニー・ギル- インタビューシリーズ」

ビニー・ギルは、複数の役職と企業を横断する多様で幅広い業務経験を持っていますビニーは現在、Kognitosの創設者兼CEOであり...

データサイエンス

アステラソフトウェアのCOO、ジェイ・ミシュラ - インタビューシリーズ

ジェイ・ミシュラは、急速に成長しているエンタープライズ向けデータソリューションの提供企業であるAstera Softwareの最高執...