PolarsによるEDA:Pandasユーザーのためのステップバイステップガイド(パート1)

'PolarsによるEDA:Pandasユーザーのためのガイド(パート1)'

Polarsを使ってデータ分析をレベルアップしましょう

Mitul Grover氏による写真

イントロダクション

時折、データ分析の方法を大きく変えるツールが登場します。Polarsは、私がそんなツールの1つだと信じています。このシリーズの記事では、このライブラリに詳しく触れ、より知名度の高い、確立されたライブラリであるPandasと比較しながら、例のデータセットを使用して分析のワークフローを紹介します。

Polarsとは何ですか?

Polarsは、Rustで書かれた高速なDataFrameライブラリです。私たち(データサイエンティスト/アナリスト)にとっては、データを整理し、データパイプラインを構築するための完全な機能セットを提供するPythonのラッパーが非常によくドキュメント化されています。Polarsに切り替えた後、次の主な利点が見えてきました:

  • はるかに高速な前処理操作
  • RAMよりも大きなデータセットの処理が可能
  • データパイプラインを適切に構造化する必要があるため、コードの品質が向上

利点の詳細は、このユーザーガイドで確認できます。速度比較については、このH20ベンチマークを参照してください。

Pandasからの切り替え

一見すると、PandasとPolarsは非常に似ているように思えます。たとえば、.read_csv().head()などのメソッドは両方で共有されているため、基本的な探索的な操作を変更することなく実行できます。しかし、ライブラリを使用し始めるほど、2つのライブラリがどれだけ異なるかに気付くでしょう。構文から考え方まで、Polarsへの切り替えは容易ではありません。そのため、これらの記事があなたのスタートを支援できることを願っています。

セットアップ

このプロジェクトに参加するには、最新のノートブックを持つこのGitHubリポジトリをプルしてください。このプロジェクトで使用されるデータはKaggleからダウンロードできます(CC0:パブリックドメイン)。これはYouTubeのトップトレンディング動画に関するデータセットであり、このシリーズの記事に十分な複雑さを提供するはずです。また、PandasとPolarsがインストールされていることが必要です。両方のパッケージはpipを使用してインストールできます。

準備が整ったので、プロジェクトに取り組みましょう!ここでは、Polarsにより詳しくなることを目標にしているので、指示に従うか、概念を実践してください。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

「ジャスティン・マクギル、Content at Scaleの創設者兼CEO - インタビューシリーズ」

ジャスティンは2008年以来、起業家、イノベーター、マーケターとして活動しています彼は15年以上にわたりSEOマーケティングを...

人工知能

ファイデムのチーフ・プロダクト・オフィサー、アルパー・テキン-インタビューシリーズ

アルパー・テキンは、FindemというAI人材の獲得と管理プラットフォームの最高製品責任者(CPO)ですFindemのTalent Data Clou...

データサイエンス

「Adam Ross Nelsonによる自信のあるデータサイエンスについて」

データサイエンスの中で新たな分野が現れ、研究内容が理解しにくい場合は、専門家や先駆者と話すのが最善です最近、私たちは...

人工知能

「マーク・A・レムリー教授による生成AIと法律について」

データサイエンス内で新しい分野が現れ、研究内容が理解しにくい場合は、専門家やパイオニアと話すことが最善です最近、私た...

人工知能

「シフトのCEOであるクリス・ナーゲル – インタビューシリーズ」

クリスはSiftの最高経営責任者です彼は、Ping Identityを含むベンチャー支援および公開SaaS企業のシニアリーダーシップポジシ...

人工知能

「LeanTaaSの創設者兼CEO、モハン・ギリダラダスによるインタビューシリーズ」

モーハン・ギリダラダスは、AIを活用したSaaSベースのキャパシティ管理、スタッフ配置、患者フローのソフトウェアを提供する...