「Matplotlibを使用してデータ範囲を可視化する」
「Matplotlibを使ってデータの範囲を視覚化する方法」
NOAAのハリケーンの展望のベンチマーキング
離散データのプロットは簡単ですが、データ範囲の表現はより複雑です。幸いにも、Pythonのmatplotlibライブラリには組み込みのfill_between()
関数があり、データ範囲を簡単に視覚化できます。このクイックサクセスデータサイエンスプロジェクトでは、それを使用してNational Oceanic and Atmospheric Administration(NOAA)の毎年のハリケーン展望をベンチマークします。
データセット
NOAAは毎年5月に、6月から11月のハリケーンシーズンのための「大西洋ハリケーンの展望」という報告書を公開しています。これらの展望には、名前がついた嵐、ハリケーン、およびメジャーハリケーン(カテゴリー3以上と定義される)の予測範囲が含まれています。2021年の報告書の例はこちらで見つけることができます[1]。NOAA/National Weather Serviceのデータは、米国政府からオープンデータとして提供され、任意の目的で無料で使用できます。
これらの予測の正確性をベンチマークするために、Wikipediaが提供する年次ハリケーンシーズンの概要を使用します。これらの概要には、各年の実際の嵐とハリケーンの数が示されています。2021年のシーズンのエントリはこちらで見つけることができます[2]。WikipediaページはCC BY-SA 4.0ライセンスの下で提供されます。
Wikipediaにはまた、La NiñaおよびEl Niñoのイベント[3][4]についてのリストも含まれています。これらは数年ごとに太平洋で発生する気象パターンを表しています。La Niña年では、東太平洋の水温が通常よりも低くなり、その上の空気が冷却されます。一方、El Niño年では逆の現象が起こります。
La Niñaパターンは大西洋盆地でのより強力なハリケーン活動を好み、El Niñoはハリケーンの発生を抑制します[5]。これを確認するために、プロットをこれらのイベントのためにカラーコード化します。
便宜上、私はすでに2001年から2022年までのすべての情報をまとめて、このGistにCSVファイルとして保存しました。
NOAAは毎年8月に更新されたハリケーン予測を発行しているため、データの選択と予測の参照に注意する必要があります。ここでは、5月の展望を使用します。
ライブラリのインストール
データの操作にはpandasを、プロットにはmatplotlibを使用します。いずれかの方法でインストールしてください:
conda install matplotlib pandas
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- 生成AIのアシストを使用して複雑なSQLクエリを作成する
- 「データの成熟度ピラミッド:レポートから先進的なインテリジェントデータプラットフォームへ」
- 「大規模な言語モデルは本当に複雑な構造化データを生成するのに優れているのか?このAI論文では、Struc-Benchを紹介し、LLMの能力を評価し、構造に注意したFine-Tuningの解決策を提案します」
- 「BComを修了後、どのようにデータサイエンティストになるか?」
- 「AIコントロールを手にして、サイバーセキュリティシステムに挑戦しましょう」
- なぜNASAが国家の秘密を月に送っているのか
- 声サンプルデータ分析を使用したパーキンソン病の診断:特徴選択