「Pandasの結合操作を実行するための長すぎる(しかし優れた)ガイド」

「Pandasの結合操作に関するガイド」

セミ/アンチ結合からデータのマージの検証へ

Midjourneyによるイメージ

現実のデータには、単一の穏やかなCSVファイルではなく、多くの方法でお互いに共通の列を使用して相互作用するテーブルの束が含まれているという厄介な衝撃があります。

これらの相互作用を活用して、混乱から洞察を見つけ出すことがあなたの不運な仕事です。そして、そのタスクを実行するために最も重要なスキルは、テーブル間の結合を実行することです。

したがって、今日の私の不運な仕事は、Pandasでこれらの結合を行うほぼすべての方法を教えることです。コーヒーを用意してください。時間がかかります。

Pandasのmerge()

Pandasは、データフレーム上でマージを行うためのいくつかのメソッドを提供しています。その中でも、merge()メソッドは最も柔軟性があります。これはデータフレームのメソッドであり、一般的な構文は以下のようになります:

df1.merge(df2, on='common_column')

テーブルを結合する際には、2つの用語に慣れておく必要があります。最初に使用するテーブルの名前は左側のテーブルと呼ばれ、もう一方は右側のテーブルと呼ばれます。上記のコードスニペットでは、左側のテーブルはdf1であり、右側のテーブルはdf2です。また、結合、結合、マージの動詞はすべて交換可能に使用されます。

では、内部結合を行う方法を見てみましょう:

内部結合は、両方のテーブルで一致する値を持つ行のみを返します。結合プロセス中に、両方のテーブルで共通の列名を知る必要があります。

基本的な探索

記事で使用するいくつかのデータセットに慣れてみましょう。

以下の2つのテーブルがあるとしましょう:

>>> user_usage.head()

>>> user_devices.head()

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

データサイエンス

「David Smith、TheVentureCityの最高データオフィサー- インタビューシリーズ」

デビッド・スミス(別名「デビッド・データ」)は、TheVentureCityのチーフデータオフィサーであり、ソフトウェア駆動型のス...

人工知能

『DeepHowのCEO兼共同創業者、サム・ジェン氏によるインタビューシリーズ』

ディープハウのCEO兼共同創設者であるサム・ジェンは、著名な投資家から支持される急速に進化するスタートアップを率いていま...

データサイエンス

アステラソフトウェアのCOO、ジェイ・ミシュラ - インタビューシリーズ

ジェイ・ミシュラは、急速に成長しているエンタープライズ向けデータソリューションの提供企業であるAstera Softwareの最高執...

人工知能

「UVeyeの共同設立者兼CEO、アミール・ヘヴェルについてのインタビューシリーズ」

アミール・ヘヴァーは、UVeyeのCEO兼共同創設者であり、高速かつ正確な異常検出により、自動車およびセキュリティ産業に直面...

人工知能

「ゲイリー・ヒュースティス、パワーハウスフォレンジクスのオーナー兼ディレクター- インタビューシリーズ」

ゲイリー・ヒュースティス氏は、パワーハウスフォレンジックスのオーナー兼ディレクターであり、ライセンスを持つ私立探偵、...

人工知能

ジョナサン・ダムブロット、Cranium AIのCEO兼共同創設者- インタビューシリーズ

ジョナサン・ダムブロットは、Cranium AIのCEO兼共同創業者ですCranium AIは、サイバーセキュリティおよびデータサイエンスチ...