データ分析のためのPandas

Pandas for Data Analysis

pandasを使ってデータを簡単に分析する方法を学びましょう

写真 by Sid Balachandran on Unsplash

pandasは、高速で柔軟かつ表現力豊かなデータ構造を提供し、データの取り扱いを容易にするPythonのパッケージであり、オープンソースのデータ分析および操作ツールです。Pythonでの実用的なデータ分析には基本的なものです。

データを扱う際には、データセットの性質を良く理解しておく必要があります。そのためにはpandasが最適なツールです。さあ、pandasが提供するさまざまな関数や機能を学んでみましょう。

まず、システムにpandasがインストールされていることを確認してください

condaを使用する場合:

conda install pandas

pipを使用する場合:

pip install pandas

pandasは、2つの主要なコンポーネントを提供しています:

  1. Series
  2. DataFrames

1. Series

Seriesは、リストに似ています。1次元の配列と考えることができます。デフォルトでは、各アイテムには0から(n-1)までのインデックスラベルが付けられます。nはSeriesのサイズです。任意の名前のリストでSeriesを作成しましょう。

>>> s = pd.Series(('Jen', 'Neil', 'Jay', 'Dan', 'Kev', 'Mo'))>>> print(s)0     Jen 1    Neil 2     Jay 3     Dan 4     Kev 5      Mo dtype: object

すべての名前は、0からn-1までの数値でインデックス付けされます。

‘dtype’プロパティについては、DataFrame内のデータ型を見つけるために使用されます。それは、各列のデータ型を持つSeriesを返します。混合型の列は、オブジェクトのデータ型で格納されます。

整数インデックス

次に、Seriesから特定のアイテムを選択します。これには整数インデックスを使用することができます。以下にその例を示します。

>>> print(s[1])Neil

スライシング

3から5のアイテムを選択するには、スライシング技術を使用します。これにより、Seriesからアイテムの範囲を選択できます。

>>> print(s[2:4])2    Jay 3    Dan dtype: object

これにはインデックス4のアイテムは含まれません。インデックスが2と3のアイテムのみが返されます。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more