UCLAの研究者が、最新の気候データと機械学習モデルに簡単で標準化された方法でアクセスするためのPythonライブラリ「ClimateLearn」を開発しました

UCLAの研究者が、Pythonライブラリ「ClimateLearn」を開発しましたこのライブラリは、最新の気候データと機械学習モデルに簡単で標準化された方法でアクセスすることができます

極端な気象条件は、特に最近の数年間においては典型的な出来事となっています。気候変動が、パキスタンで見られる豪雨による大規模な洪水から、ポルトガルとスペイン全土で野火を煽った熱波まで、このような極端な天候現象の主な要因です。もし適切な対策が早急に講じられない場合、地球の平均地表温度は次の10年間で約4度上昇すると予測されています。科学者によると、この温度上昇はより頻繁な極端な天候事象の発生にさらに寄与するでしょう。

一般循環モデル(GCM)は、科学者が将来の天候と気候を予測するために使用するツールです。GCMは、温度、風速、降水量などのさまざまな変数の予測を生成するために時間をかけて積分できる微分方程式のシステムです。これらのモデルは非常に理解しやすく、非常に正確な結果を提供します。ただし、これらのモデルを実行するには、かなりの計算能力が必要です。さらに、多くのトレーニングデータがある場合、モデルの微調整が困難になります。

ここで、機械学習の技術が役立つことが証明されています。特に「天気予報」と「空間ダウンスケーリング」において、これらのアルゴリズムは確立された気候モデルと競争力を持つことが証明されています。天気予報は将来の気候変数を予測することを指し、例えば、前の週の日降水量(cm)の情報を使用して、来週のメーガラヤでの降水量を予測する必要があります。空間ダウンスケーリングとは、例えば100 km x 100 kmのグリッドから1 km x 1 kmにスケーリングすることを指す、空間的に粗い気候モデルの予測の問題です。

予測とダウンスケーリングは、さまざまなコンピュータビジョンのタスクに類似することがあります。ただし、天気予報、空間ダウンスケーリング、および他のCVタスクの主な違いは、機械学習モデルがさまざまな形式の外部入力を利用する必要があることです。例えば、湿度や風速などの要素と過去の地表温度は、将来の地表温度に影響を与えます。これらの変数は、地表温度と共にモデルへの入力として提供される必要があります。

深層学習の研究は近年急速に進展しており、機械学習と気候変動を研究する科学者たちは、深層学習の技術が天気予報や空間ダウンスケーリングの問題にどのように対処できるかを調査しています。機械学習の適用においては、2つは対照的なアプローチを取ります。機械学習を研究する科学者たちは、どのアーキテクチャがどの問題に最適であり、どのようにデータを処理すれば現代の機械学習手法に適しているかに重点を置きます。一方、気候科学者は物理方程式をより多く活用し、必要な評価指標を念頭に置きます。

ただし、気候モデリングにおける「バイアス」と機械学習における「バイアス」といった曖昧な言語、気候科学の課題に対する機械学習のアプリケーションの標準化の欠如、気候データの解析に対する専門知識の不足などが、その全体的な能力を引き出すことを妨げています。これらの問題に対処するため、カリフォルニア大学ロサンゼルス校(UCLA)の研究者たちは、ClimateLearnというPythonパッケージを開発しました。これにより、巨大な気候データと最先端の機械学習モデルに簡単に、標準化されたアクセスが可能となります。パッケージを介して、さまざまなデータセット、最新の基準モデル、および一連のメトリックと可視化がすべて利用可能であり、天気予報と空間ダウンスケーリング技術の大規模なベンチマーキングが可能となります。

ClimateLearnは、現在の深層学習アーキテクチャが簡単に利用できる形式でデータを提供します。パッケージには、歴史的なグローバル気候の第5世代再解析であるERA5のデータや、ヨーロッパ気象衛星の気象データ(ECMWF)が含まれています。再解析データセットは、モデリングとデータ同化技術を使用して、歴史的データをグローバルな推定値に統合します。この実データとモデリングの組み合わせにより、再解析ソリューションは合理的な精度で完全なグローバルデータを持つことができます。ClimateLearnは、生のERA5データに加えて、データ駆動型天気予測のためのベンチマークデータセットであるWeatherBenchの前処理済みERA5データもサポートしています。

ClimateLearnに実装されている基準モデルは、気候タスクに適した調整が行われており、気候科学の他の下流パイプラインにも容易に拡張できます。線形回帰、持続性、気候論などの単純な統計的技術は、ClimateLearnがサポートする標準的な機械学習アルゴリズムの範囲の一部です。リザイドコンボリューショナルニューラルネットワーク、Uネット、ビジョントランスフォーマなど、より高度な深層学習アルゴリズムも利用可能です。さらに、ClimateLearnは、(緯度に重みを付けた)平均二乗誤差、異常相関係数、ピアソンの相関係数などのメトリックを使用して、モデルの予測を素早く可視化するサポートも提供します。さらに、ClimateLearnはモデルの予測、真の値、およびその間の差異の可視化も提供します。

ClimateLearnを開発する研究者の主な目標は、気候科学と機械学習のコミュニティ間のギャップを埋めることです。これを実現するために、気候データセットへの容易なアクセス、比較のためのベースラインモデルの提供、モデルの出力を理解するための可視化メトリクスを提供しています。近い将来、研究者はCMIP6(第6世代気候モデリング相互比較プロジェクト)などの新しいデータセットのサポートを追加する予定です。チームはまた、新たな不確実性の定量化メトリクスやベイズニューラルネットワークや拡散モデルなどのいくつかの機械学習手法による確率予測もサポートします。モデルの性能、表現力、頑健性についてより詳しく知ることで、機械学習の研究者が開拓できる追加の機会について、研究者たちは非常に熱心です。さらに、気候科学者は入力変数の値を変更することで結果の分布がどのように変化するかを理解することができます。チームはまた、パッケージをオープンソース化し、コミュニティの貢献を期待しています。

新しいPyTorchライブラリClimateLearnをご紹介します。気候データセット、最先端のMLモデル、高品質なトレーニングおよび可視化パイプラインにアクセスするためのものです。ブログ:https://t.co/BarGdNWQiT ドキュメント:https://t.co/RBiQFbeqaJ クイックスタートColab:https://t.co/RjgqOo2tX0 (1/n)

— Aditya Grover (@adityagrover_) January 13, 2023

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more