「2つのPandas DataFrameを比較するための簡単な方法3つ」

3 easy methods to compare two Pandas DataFrames

データサイエンス

パンダのデータフレーム間で共通の行と非共通の行を素早く見つける方法を学びましょう。

Photo by Meghan Hessler on Unsplash

簡単なタスクです- パンダの組み込みメソッドを使用すると簡単にできます。

PythonのPandasでは、データを表形式(行と列)で格納し、有用な洞察を得るために操作することができる最もシンプルなデータ構造であるデータフレームがあります。

実際のシナリオで作業していると、データアナリストの一般的なタスクの1つは、データの変更を確認することです。そして、2つのデータセットを比較することでそれを行うことができます。

最近、私は自動化されたコンピュータビジョンシステムを開発しました。このシステムは2つの異なる時間で10台のデバイスからデータを収集し、2つのパンダのデータフレームに格納します。システム内で何が変更されたかを理解するために、私は2つのデータフレームを比較しました。それがこの記事のインスピレーションの源です。

データフレームの比較アプリケーションは、データの検証、データの変更の検出、テスト、デバッグなどで最も一般的に見られます。したがって、2つのデータセットを素早く簡単に比較する方法を知ることは重要です。

したがって、この記事では、パンダで2つのデータフレームを比較する3つの最良で最も簡単で信頼性の高い方法を説明します。以下の目次でストーリーの概要を確認できます。

· equals()を使用してパンダのデータフレームを比較する· concat()を使用してパンダのデータフレームを比較する· compare()を使用してパンダのデータフレームを比較する

さあ、始めましょう!

2つのデータフレームを比較する3つの方法を始める前に、それぞれにわずかな違いのある2つのデータフレームを作成しましょう。

import pandas as pddf = pd.DataFrame({"device_id": ['D475', 'D175', 'D200', 'D375', 'M475', 'M400', 'M250', 'A150'],                   "device_temperature": [35.4, 45.2, 59.3, 49.3, 32.2, 35.7, 36.8, 34.9],                   "device_status": ["Inactive", "Active", "Active", "Active", "Active", "Inactive", "Active", "Active"]})df1 = pd.DataFrame({"device_id": ['D475', 'D175', 'D200', 'D375', 'M475', 'M400', 'M250', 'A150'],                   "device_temperature": [39.4, 45.2, 29.3, 49.3, 32.2, 35.7, 36.8, 24.9]…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Related articles

Discover more