「Pandasの結合操作を実行するための長すぎる(しかし優れた)ガイド」

「Pandasの結合操作に関するガイド」

セミ/アンチ結合からデータのマージの検証へ

Midjourneyによるイメージ

現実のデータには、単一の穏やかなCSVファイルではなく、多くの方法でお互いに共通の列を使用して相互作用するテーブルの束が含まれているという厄介な衝撃があります。

これらの相互作用を活用して、混乱から洞察を見つけ出すことがあなたの不運な仕事です。そして、そのタスクを実行するために最も重要なスキルは、テーブル間の結合を実行することです。

したがって、今日の私の不運な仕事は、Pandasでこれらの結合を行うほぼすべての方法を教えることです。コーヒーを用意してください。時間がかかります。

Pandasのmerge()

Pandasは、データフレーム上でマージを行うためのいくつかのメソッドを提供しています。その中でも、merge()メソッドは最も柔軟性があります。これはデータフレームのメソッドであり、一般的な構文は以下のようになります:

df1.merge(df2, on='common_column')

テーブルを結合する際には、2つの用語に慣れておく必要があります。最初に使用するテーブルの名前は左側のテーブルと呼ばれ、もう一方は右側のテーブルと呼ばれます。上記のコードスニペットでは、左側のテーブルはdf1であり、右側のテーブルはdf2です。また、結合、結合、マージの動詞はすべて交換可能に使用されます。

では、内部結合を行う方法を見てみましょう:

内部結合は、両方のテーブルで一致する値を持つ行のみを返します。結合プロセス中に、両方のテーブルで共通の列名を知る必要があります。

基本的な探索

記事で使用するいくつかのデータセットに慣れてみましょう。

以下の2つのテーブルがあるとしましょう:

>>> user_usage.head()

>>> user_devices.head()

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AIテクノロジー

アンソニー・グーネティレケ氏は、Amdocsのグループ社長であり、テクノロジー部門および戦略部門の責任者です- インタビューシリーズ

アンソニー・グーネティレーケは、Amdocsでグループ社長、テクノロジーと戦略担当です彼と企業戦略チームは、会社の戦略を策...

機械学習

「機械学習 vs AI vs ディープラーニング vs ニューラルネットワーク:違いは何ですか?」

テクノロジーの急速な進化は、ビジネスが効率化のために洗練されたアルゴリズムにますます頼ることで、私たちの日常生活を形...

人工知能

「スノーケルAIのCEO兼共同創設者、アレックス・ラットナー - インタビューシリーズ」

アレックス・ラトナーは、スタンフォードAIラボを母体とする会社、Snorkel AIのCEO兼共同創設者ですSnorkel AIは、手作業のAI...

機械学習

「Prolificの機械学習エンジニア兼AIコンサルタント、ノラ・ペトロヴァ – インタビューシリーズ」

『Nora Petrovaは、Prolificの機械学習エンジニア兼AIコンサルタントですProlificは2014年に設立され、既にGoogle、スタンフ...

人工知能

「アナコンダのCEO兼共同創業者、ピーターウォングによるインタビューシリーズ」

ピーター・ワンはAnacondaのCEO兼共同創設者ですAnaconda(以前はContinuum Analyticsとして知られる)を設立する前は、ピー...

人工知能

『DeepHowのCEO兼共同創業者、サム・ジェン氏によるインタビューシリーズ』

ディープハウのCEO兼共同創設者であるサム・ジェンは、著名な投資家から支持される急速に進化するスタートアップを率いていま...