「Pandas の重要な指標関連操作6つの基本知識」

『パンダの重要な指標関連操作6つの基本知識』

データフレームで効果的にインデックスを扱う方法

Photo by Alejandro Luengo on Unsplash

何千冊もの本で溢れた図書館があると想像してください。それぞれの本には豊富な情報が詰まっています。必要な本を見つけるために、図書館のインデックスを参照するでしょうね。実際のデータを扱う場合、膨大な量のデータをふるいにかけ、求めているものをピンポイントで見つけるために、図書館のようなインデックスは欠かせません。

この記事では、一般的で重要なインデックス関連の操作をいくつか共有し、それらをシンプルな適用シナリオで解説します。データの初心者でもベテランでも、これらの操作がデータの最良の味方になることにすぐに気付くでしょう。

それでは、さっそく始めましょう。

ちなみに、データフレームでは、行と列の両方がインデックスとみなされますが、ほとんどのデータ操作では、行のみが関心の対象のインデックスとして考慮されます。なぜなら、多くのデータセットはワイドフォーマットで表現されているからです。各行は1つのデータレコードを表し、列はデータレコードのさまざまな側面を表します。この記事では、行を基準にインデックスを操作することに焦点を当てます。つまり、インデックスの各アイテムは行に応じています。

1. インデックスの設定

一般的なデータ操作は、CSVファイルなどの表形式のデータソースからデータをインポートすることから始まります。次のスクリーンショットはGitHubからのオンラインデータソースを示しています。

The source data used in this blog article (screenshot by author)

このファイルをインポートすると、ソースファイルで見た3つの列の前に名前のない「余分な」列が表示されます。

# ライブラリから生データを読み込むimport pandas as pdデータURL = "https://raw.githubusercontent.com/mwaskom/seaborn-data/master/flights.csv"df = pd.read_csv(データURL)df
The data frame read from the source showing the index

自動生成されたインデックスは0から始まり、追加の行ごとに1ずつ増加します。あなたは…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more