「Pandas の重要な指標関連操作6つの基本知識」
『パンダの重要な指標関連操作6つの基本知識』
データフレームで効果的にインデックスを扱う方法
何千冊もの本で溢れた図書館があると想像してください。それぞれの本には豊富な情報が詰まっています。必要な本を見つけるために、図書館のインデックスを参照するでしょうね。実際のデータを扱う場合、膨大な量のデータをふるいにかけ、求めているものをピンポイントで見つけるために、図書館のようなインデックスは欠かせません。
この記事では、一般的で重要なインデックス関連の操作をいくつか共有し、それらをシンプルな適用シナリオで解説します。データの初心者でもベテランでも、これらの操作がデータの最良の味方になることにすぐに気付くでしょう。
それでは、さっそく始めましょう。
ちなみに、データフレームでは、行と列の両方がインデックスとみなされますが、ほとんどのデータ操作では、行のみが関心の対象のインデックスとして考慮されます。なぜなら、多くのデータセットはワイドフォーマットで表現されているからです。各行は1つのデータレコードを表し、列はデータレコードのさまざまな側面を表します。この記事では、行を基準にインデックスを操作することに焦点を当てます。つまり、インデックスの各アイテムは行に応じています。
1. インデックスの設定
一般的なデータ操作は、CSVファイルなどの表形式のデータソースからデータをインポートすることから始まります。次のスクリーンショットはGitHubからのオンラインデータソースを示しています。
このファイルをインポートすると、ソースファイルで見た3つの列の前に名前のない「余分な」列が表示されます。
# ライブラリから生データを読み込むimport pandas as pdデータURL = "https://raw.githubusercontent.com/mwaskom/seaborn-data/master/flights.csv"df = pd.read_csv(データURL)df
自動生成されたインデックスは0から始まり、追加の行ごとに1ずつ増加します。あなたは…
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles