「Pandasの結合操作を実行するための長すぎる(しかし優れた)ガイド」

「Pandasの結合操作に関するガイド」

セミ/アンチ結合からデータのマージの検証へ

Midjourneyによるイメージ

現実のデータには、単一の穏やかなCSVファイルではなく、多くの方法でお互いに共通の列を使用して相互作用するテーブルの束が含まれているという厄介な衝撃があります。

これらの相互作用を活用して、混乱から洞察を見つけ出すことがあなたの不運な仕事です。そして、そのタスクを実行するために最も重要なスキルは、テーブル間の結合を実行することです。

したがって、今日の私の不運な仕事は、Pandasでこれらの結合を行うほぼすべての方法を教えることです。コーヒーを用意してください。時間がかかります。

Pandasのmerge()

Pandasは、データフレーム上でマージを行うためのいくつかのメソッドを提供しています。その中でも、merge()メソッドは最も柔軟性があります。これはデータフレームのメソッドであり、一般的な構文は以下のようになります:

df1.merge(df2, on='common_column')

テーブルを結合する際には、2つの用語に慣れておく必要があります。最初に使用するテーブルの名前は左側のテーブルと呼ばれ、もう一方は右側のテーブルと呼ばれます。上記のコードスニペットでは、左側のテーブルはdf1であり、右側のテーブルはdf2です。また、結合、結合、マージの動詞はすべて交換可能に使用されます。

では、内部結合を行う方法を見てみましょう:

内部結合は、両方のテーブルで一致する値を持つ行のみを返します。結合プロセス中に、両方のテーブルで共通の列名を知る必要があります。

基本的な探索

記事で使用するいくつかのデータセットに慣れてみましょう。

以下の2つのテーブルがあるとしましょう:

>>> user_usage.head()

>>> user_devices.head()

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

キャルレールの最高製品責任者、ライアン・ジョンソンへのインタビューシリーズ

ライアンは、初期のスタートアップからフォーチュン100の組織まで、多様なテクノロジーと製品開発のリーダーシップ経験を15年...

機械学習

もし芸術が私たちの人間性を表現する方法であるなら、人工知能はどこに適合するのでしょうか?

MITのポストドクターであるジヴ・エプスタイン氏(SM '19、PhD '23)は、芸術やその他のメディアを作成するために生成的AIを...

人工知能

「ナレ・ヴァンダニャン、Ntropyの共同創設者兼CEO- インタビューシリーズ」

Ntropyの共同創設者兼CEOであるナレ・ヴァンダニアンは、開発者が100ミリ秒未満で超人的な精度で金融取引を解析することを可...

人工知能

「スノーケルAIのCEO兼共同創設者、アレックス・ラットナー - インタビューシリーズ」

アレックス・ラトナーは、スタンフォードAIラボを母体とする会社、Snorkel AIのCEO兼共同創設者ですSnorkel AIは、手作業のAI...

人工知能

ファイデムのチーフ・プロダクト・オフィサー、アルパー・テキン-インタビューシリーズ

アルパー・テキンは、FindemというAI人材の獲得と管理プラットフォームの最高製品責任者(CPO)ですFindemのTalent Data Clou...

人工知能

「コマンドバーの創設者兼CEO、ジェームズ・エバンスによるインタビューシリーズ」

ジェームズ・エバンズは、CommandBarの創設者兼CEOであり、製品、マーケティング、顧客チームを支援するために設計されたAIパ...