「Numexprの探索:Pandasの背後にある強力なエンジン」

Numexpr検索:Pandasの強力なエンジン

高速なコンピューティング

PythonのNumexprとPandasのeval/query関数を使用してデータ分析のパフォーマンスを向上させる

Numexprを使用して、最も住みやすい都市を見つけるのを助けてください。 写真クレジット:作者による作成、Canva

この記事では、PythonライブラリであるNumexprについて紹介します。Numexprは、Numpy Arraysの計算パフォーマンスを向上させるツールです。Pandasのevalメソッドとqueryメソッドもこのライブラリをベースにしています。

この記事では、実践的な天気データ分析プロジェクトも取り上げます。

この記事を読むことで、Numexprの原理を理解し、この強力なツールを使用して計算を高速化する方法を学ぶことができます。

イントロダクション

Numpy配列の復習

以前の記事で、Numpy配列についての例を使用して、なぜNumpyのキャッシュ局所性が効率的なのかを説明しました。

PythonのリストとNumPy配列:メモリレイアウトとパフォーマンスの利点についての詳細な調査

割り当ての違いと効率の向上を探る

towardsdatascience.com

図書館に資料を探しに行くたびに、関連する本をいくつか取り出し、デスクのそばに置きます。

これにより、本を読むたびに本棚に走る必要なく、関連する資料を素早く確認できます。

特に多くの関連書籍を参照する必要がある場合、この方法は多くの時間を節約します。

このシナリオでは、本棚がメモリに相当し、デスクがCPUのL1キャッシュに相当し、読者がCPUのコアに相当します。

CPUがRAMにアクセスすると、キャッシュはキャッシュライン全体を高速キャッシュに読み込みます。 作者による画像

Numpyの制約

運悪く、シェイクスピアとトルストイの作品をクロス比較するよう要求される厳しい教授に出くわしたとしましょう。

この時点で、事前に関連する本を取り出すことはうまくいきません。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

3つの質問:大規模言語モデルについて、Jacob Andreasに聞く

CSAILの科学者は、最新の機械学習モデルを通じた自然言語処理の研究と、言語が他の種類の人工知能をどのように高めるかの調査...

データサイエンス

「2023年にデータサイエンスFAANGの仕事をゲットする方法は?」

データサイエンスは非常に求められる分野となり、FAANG(Facebook、Amazon、Apple、Netflix、Google)企業での就職は大きな成...

人工知能

「ジャスティン・マクギル、Content at Scaleの創設者兼CEO - インタビューシリーズ」

ジャスティンは2008年以来、起業家、イノベーター、マーケターとして活動しています彼は15年以上にわたりSEOマーケティングを...

人工知能

「リオール・ハキム、Hour Oneの共同創設者兼CTO - インタビューシリーズ」

「Hour Oneの共同創設者兼最高技術責任者であるリオール・ハキムは、専門的なビデオコミュニケーションのためのバーチャルヒ...

機械学習

「Prolificの機械学習エンジニア兼AIコンサルタント、ノラ・ペトロヴァ – インタビューシリーズ」

『Nora Petrovaは、Prolificの機械学習エンジニア兼AIコンサルタントですProlificは2014年に設立され、既にGoogle、スタンフ...

人工知能

「Zenの共同創設者兼CTO、イオン・アレクサンドル・セカラ氏によるインタビューシリーズ」

創業者兼CTOであるIon-Alexandru Secaraは、Zen(PostureHealth Inc.)の開発を牽引しており、画期的な姿勢矯正ソフトウェア...