「PandasのDataFrameに列を追加する10の方法」

「PandasのDataFrameに列を追加する方法」

頻繁に新しい列を派生または作成する必要があります

Photo by Austin Chan on Unsplash

DataFrameは、ラベル付きの行と列を持つ2次元のデータ構造です。データ分析や特徴エンジニアリングの一環として、新しい列を追加する必要があります。

新しい列を追加する方法はさまざまです。最適な方法は、手元のタスクによって異なります。

この記事では、PandasのDataFrameに列を追加する10の方法を学びます。

PandasのDataFrameコンストラクタを使用して、単純なDataFrameを作成することから始めましょう。データは、列名がキーであるPythonのdictionaryとして渡されます。

import pandas as pd# DataFrameを作成df = pd.DataFrame(    {        "first_name": ["Jane", "John", "Max", "Emily", "Ashley"],        "last_name": ["Doe", "Doe", "Dune", "Smith", "Fox"],        "id": [101, 103, 143, 118, 128]    }   )# DataFrameを表示df
df (image by author)

1. 定数値の使用

次のように、定数値の新しい列を追加することができます:

df.loc[:, "department"] = "engineering"# DataFrameを表示df
df (image by author)

2. 配列構造の使用

配列構造を使用して新しい列を追加することができます。この場合、配列内の値の数はDataFrameの行数と同じであることを確認してください。

df.loc[:, "salary"] = [45000, 43000, 42000, 45900, 54000]

上記の例では、Pythonのリストを使用しました。NumPyのrandomモジュールを使用してランダムに値を決定しましょう。

import numpy as npdf.loc[:, "salary"] = np.random.randint(40000, 55000, size=5)# DataFrameを表示df

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more