「Numexprの探索:Pandasの背後にある強力なエンジン」

Numexpr検索:Pandasの強力なエンジン

高速なコンピューティング

PythonのNumexprとPandasのeval/query関数を使用してデータ分析のパフォーマンスを向上させる

Numexprを使用して、最も住みやすい都市を見つけるのを助けてください。 写真クレジット:作者による作成、Canva

この記事では、PythonライブラリであるNumexprについて紹介します。Numexprは、Numpy Arraysの計算パフォーマンスを向上させるツールです。Pandasのevalメソッドとqueryメソッドもこのライブラリをベースにしています。

この記事では、実践的な天気データ分析プロジェクトも取り上げます。

この記事を読むことで、Numexprの原理を理解し、この強力なツールを使用して計算を高速化する方法を学ぶことができます。

イントロダクション

Numpy配列の復習

以前の記事で、Numpy配列についての例を使用して、なぜNumpyのキャッシュ局所性が効率的なのかを説明しました。

PythonのリストとNumPy配列:メモリレイアウトとパフォーマンスの利点についての詳細な調査

割り当ての違いと効率の向上を探る

towardsdatascience.com

図書館に資料を探しに行くたびに、関連する本をいくつか取り出し、デスクのそばに置きます。

これにより、本を読むたびに本棚に走る必要なく、関連する資料を素早く確認できます。

特に多くの関連書籍を参照する必要がある場合、この方法は多くの時間を節約します。

このシナリオでは、本棚がメモリに相当し、デスクがCPUのL1キャッシュに相当し、読者がCPUのコアに相当します。

CPUがRAMにアクセスすると、キャッシュはキャッシュライン全体を高速キャッシュに読み込みます。 作者による画像

Numpyの制約

運悪く、シェイクスピアとトルストイの作品をクロス比較するよう要求される厳しい教授に出くわしたとしましょう。

この時点で、事前に関連する本を取り出すことはうまくいきません。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

データサイエンス

「3つの質問:ロボットの認識とマッピングの研磨」

MIT LIDSのLuca CarloneさんとJonathan Howさんは、将来のロボットが環境をどのように知覚し、相互作用するかについて議論し...

人工知能

「ジンディのCEO兼共同創設者、セリーナ・リー― インタビューシリーズ」

「Celina Leeは、ZindiのCEO兼共同創設者であり、アフリカのデータサイエンティスト向けの最大の専門ネットワークです Celina...

人工知能

ファイデムのチーフ・プロダクト・オフィサー、アルパー・テキン-インタビューシリーズ

アルパー・テキンは、FindemというAI人材の獲得と管理プラットフォームの最高製品責任者(CPO)ですFindemのTalent Data Clou...

人工知能

「Zenの共同創設者兼CTO、イオン・アレクサンドル・セカラ氏によるインタビューシリーズ」

創業者兼CTOであるIon-Alexandru Secaraは、Zen(PostureHealth Inc.)の開発を牽引しており、画期的な姿勢矯正ソフトウェア...

人工知能

『ジュリエット・パウエル&アート・クライナー、The AI Dilemma – インタビューシリーズの著者』

『AIのジレンマ』は、ジュリエット・パウエルとアート・クライナーによって書かれましたジュリエット・パウエルは、著者であ...

人工知能

「シフトのCEOであるクリス・ナーゲル – インタビューシリーズ」

クリスはSiftの最高経営責任者です彼は、Ping Identityを含むベンチャー支援および公開SaaS企業のシニアリーダーシップポジシ...