「Pandasの結合操作を実行するための長すぎる(しかし優れた)ガイド」
「Pandasの結合操作に関するガイド」
セミ/アンチ結合からデータのマージの検証へ
現実のデータには、単一の穏やかなCSVファイルではなく、多くの方法でお互いに共通の列を使用して相互作用するテーブルの束が含まれているという厄介な衝撃があります。
これらの相互作用を活用して、混乱から洞察を見つけ出すことがあなたの不運な仕事です。そして、そのタスクを実行するために最も重要なスキルは、テーブル間の結合を実行することです。
したがって、今日の私の不運な仕事は、Pandasでこれらの結合を行うほぼすべての方法を教えることです。コーヒーを用意してください。時間がかかります。
Pandasのmerge()
Pandasは、データフレーム上でマージを行うためのいくつかのメソッドを提供しています。その中でも、merge()
メソッドは最も柔軟性があります。これはデータフレームのメソッドであり、一般的な構文は以下のようになります:
df1.merge(df2, on='common_column')
テーブルを結合する際には、2つの用語に慣れておく必要があります。最初に使用するテーブルの名前は左側のテーブルと呼ばれ、もう一方は右側のテーブルと呼ばれます。上記のコードスニペットでは、左側のテーブルはdf1
であり、右側のテーブルはdf2
です。また、結合、結合、マージの動詞はすべて交換可能に使用されます。
では、内部結合を行う方法を見てみましょう:
内部結合は、両方のテーブルで一致する値を持つ行のみを返します。結合プロセス中に、両方のテーブルで共通の列名を知る必要があります。
基本的な探索
記事で使用するいくつかのデータセットに慣れてみましょう。
以下の2つのテーブルがあるとしましょう:
>>> user_usage.head()
>>> user_devices.head()
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles