「Matplotlibを使用してデータ範囲を可視化する」

「Matplotlibを使ってデータの範囲を視覚化する方法」

NOAAのハリケーンの展望のベンチマーキング

Hurricane from Space by Leonardo AI DreamShaper_v7 model

離散データのプロットは簡単ですが、データ範囲の表現はより複雑です。幸いにも、Pythonのmatplotlibライブラリには組み込みのfill_between()関数があり、データ範囲を簡単に視覚化できます。このクイックサクセスデータサイエンスプロジェクトでは、それを使用してNational Oceanic and Atmospheric Administration(NOAA)の毎年のハリケーン展望をベンチマークします。

データセット

NOAAは毎年5月に、6月から11月のハリケーンシーズンのための「大西洋ハリケーンの展望」という報告書を公開しています。これらの展望には、名前がついた嵐、ハリケーン、およびメジャーハリケーン(カテゴリー3以上と定義される)の予測範囲が含まれています。2021年の報告書の例はこちらで見つけることができます[1]。NOAA/National Weather Serviceのデータは、米国政府からオープンデータとして提供され、任意の目的で無料で使用できます。

これらの予測の正確性をベンチマークするために、Wikipediaが提供する年次ハリケーンシーズンの概要を使用します。これらの概要には、各年の実際の嵐とハリケーンの数が示されています。2021年のシーズンのエントリはこちらで見つけることができます[2]。WikipediaページはCC BY-SA 4.0ライセンスの下で提供されます。

Wikipediaにはまた、La NiñaおよびEl Niñoのイベント[3][4]についてのリストも含まれています。これらは数年ごとに太平洋で発生する気象パターンを表しています。La Niña年では、東太平洋の水温が通常よりも低くなり、その上の空気が冷却されます。一方、El Niño年では逆の現象が起こります。

La Niñaパターンは大西洋盆地でのより強力なハリケーン活動を好み、El Niñoはハリケーンの発生を抑制します[5]。これを確認するために、プロットをこれらのイベントのためにカラーコード化します。

便宜上、私はすでに2001年から2022年までのすべての情報をまとめて、このGistにCSVファイルとして保存しました。

NOAAは毎年8月に更新されたハリケーン予測を発行しているため、データの選択と予測の参照に注意する必要があります。ここでは、5月の展望を使用します。

ライブラリのインストール

データの操作にはpandasを、プロットにはmatplotlibを使用します。いずれかの方法でインストールしてください:

conda install matplotlib pandas

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more