「さまざまな深層学習を用いた天気予測モデルに関する研究」

Research on deep learning-based weather prediction models

気象予測の世界的な影響を考慮して、様々な研究コミュニティの研究者の関心を引いてきました。最近のディープラーニング技術の進歩、大量の気象データの広範な提供、情報技術およびコンピュータ技術の進展により、多くの研究が気象予測のための大容量の気象データセットの中に隠れた階層的パターンを探索することに動機付けられてきました。機械学習技術は、極端な気象イベントの予測、観測およびモデル化された大気条件における極端な気象および気候パターンの特定、および激しい天候の運用ガイダンスとリスク評価に適用されてきました。過去数年間、MetNet-2、WF-UNet、ClimaX、GraphCast、Pangu-Weatherなどのディープラーニングベースの気象予測モデルの開発が進んできました。 この記事では、これらのモデルについて簡単に説明し、これらのモデルが従来の気象シミュレータに比べて大幅に優位になっているかどうかを理解します。

ClimaX:気象および気候の基礎モデル

物理学に基づいた数値大気モデルは、現在の気象および気候予測ソフトウェアの基盤です。これらの技術は非線形ダイナミクスと複雑な多変数間の相互作用をモデル化し、近似することが困難になっています。高い空間および時間分解能で大気過程を数値的にシミュレートすることは、計算的に要求が高くなります。最新の機械学習ベースのデータ駆動型技術は、ディープニューラルネットワーク内でデータ駆動型の機能マッピングをトレーニングすることにより、ダウンストリームの予測または投影タスクを直接処理します。これらのネットワークは、離散的な時空間タスクのために限られた一貫した気候データでトレーニングされるため、数値モデルの汎用性を欠いています。

Microsoft Autonomous Systems and Robotics Research、Microsoft Research AI4Science、およびUCLAによる新しい研究では、ClimaXという気象および気候科学のためのディープラーニングモデルが紹介されています。ClimaXは、さまざまなデータセット、異なる変数、空間的および時間的なカバレッジ、物理的基盤でトレーニングすることができます。ClimaXは、CMIP6気候データセットを無監督でトレーニングに使用します。広範な利用性を維持しながら計算を増やすために、ClimaXはTransformerを新しいエンコーディングと集約ブロックで拡張しています。

初期トレーニングの後、ClimaXは大気変数や異なる時間・空間スケールを含むさまざまな気候および天候のジョブを実行するために微調整することができます。低い解像度や少ない計算予算で事前トレーニングされていても、ClimaXの普遍性により、気象予測および気候予測のベンチマークでデータ駆動型のベースラインを上回る性能が得られます。

研究者たちは、この手法の普遍性がさらに多様な目的に役立つ可能性があると考えています。これには、極端な気象イベントの予測や人為的気候変動の評価など、既に事前トレーニングされたClimaXバックボーンを活用できる地球システム科学のタスクの例が含まれます。気象や気候との密接な関係があるため、農業、人口統計学、および保険科学も興味深い候補です。

Pangu-Weather:グローバル気象予測のための

Huawei Cloud Computingの研究チームが導入したPangu-Weatherは、ディープラーニングに基づくグローバル気象予測システムです。チームはECMWFの第5世代再解析(ERA5)から43年間の毎時のグローバル気象データを収集し、256百万パラメータを持ついくつかのディープニューラルネットワークをトレーニングするためのデータ駆動型の環境を作成しました。

これは、全ての変数(高度、比湿度、風速、温度など)および全ての時間スケール(1時間から1週間まで)において、最先端の数値気象予測(NWP)技術よりも正確性が向上している初めてのAIベースのアプローチです。階層的な時間集約戦略と3D Earth Specific Transformer(3DEST)アーキテクチャを使用することで、予測の正確性が向上しています。Pangu-forteは、短期から中期までの決定論的な予測を行います。気象(つまり、予測時間は1時間から1週間まで)。

Pangu-Weatherからは、台風の追跡やリアルタイムの大規模メンバーアンサンブル予測など、さまざまなダウンストリーム予測オプションが利用できます。Pangu-Weatherは、AIベースの技術がNWP技術よりも優れた性能を発揮できるかどうかという問いに答え、ディープラーニング気象予測システムの向上に向けた新しい提案を行います。

チームは、彼らのトレーニング方法がまだ完全な収束を達成していないと考えています。観測要素の数を増やし、4Dディープネットワークのトレーニングに時間次元を統合し、より深いおよび/または広いネットワークを使用する余地があります。すべてこれらは、より多くのメモリとFLOPsを持つGPUを必要とします。したがって、計算リソースのおかげで将来の気象予測はより良くなります。

マルチ解像度ディープラーニングフレームワーク

極端な気象イベントは、人の生活と経済を脅かし、年間コストは数十億ドル、人的被害は数万人に上るものです。気候変動とそれに伴う影響のため、その結果と強度が増加すると予測されています。気候予測の主要な手段である一般循環モデル(GCM)は、残念ながら気象の極端な現象を適切に定義することができません。

Verisk Analytics、Otto-von-Guericke大学、マサチューセッツ工科大学の科学者グループは、極端な気象イベントのシミュレーションを高速化するためのマルチ解像度ディープラーニングフレームワークを開発しました。バイアスを排除し、GCMシミュレーションの解像度を向上させるために、粗い解像度で行われた物理ベースのGCMと、観測データで訓練された機械学習モデルを組み合わせています。

主な要素は以下の通りです:

  • 地域モデルの高い空間解像度でのトレーニングを可能にする分割・征服トレーニング戦略
  • 極値と時空間の一貫性を強調する新しい統計的損失関数
  • 球面上の物理的プロセスのコンパクトで多スケールな表現で、スケール間のエネルギー伝達を効率的に捉えることができます。

意思決定者は、完全なスケールのバイアス補正シミュレーションを利用して、現在のシナリオを確認し、災害性気象災害への露出を任意の詳細レベルで評価することができます。

提案されたアーキテクチャにより、数百万年にわたる極端な気象シミュレーションが実現可能となり、災害イベントの数量化が向上します。多くの地理的および脅威にわたる相互依存を考慮したグローバルなシミュレーションのニーズがますます高まる中、研究者たちはこれがその要件を満たすのに役立つと信じています。

風速予測のリアルタイムバイアス補正

VoAGIレンジ天気予報センター(ECMWF; 以下EC)の予報は、海洋災害警戒システムの開発の基盤となりますが、いくつかの系統的なバイアスがあります。欧州委員会の第5世代大気再解析(ERA5)データは非常に正確ですが、数日遅れています。ECとERA5データの非線形マッピングを改善するために、時空間的なディープラーニングアプローチを使用してECからより正確なリアルタイム風速予測を行うことができます。

中国海洋大学、国家海洋環境予報センター、ポーツマス大学の最近の研究では、シングルモデルを使用して風速と風向を修正するためのマルチタスク学習損失関数を設計しました。このモデルは、強化された「ダブルエンコーダ予測ユニット」アーキテクチャを使用して、時空間の風成分をモデル化します。西太平洋(WNP)が研究地域として使用されました。ECの10日間の風場予測は、2020年12月から2021年11月までの四季にわたり、リアルタイムでローリングバイアスが補正されました。MT-DETrajGRUモデルで調整された後、風速と風向のバイアスは、元のEC予測と比較して、四季でそれぞれ8〜11%と9〜14%減少しました。

さらに、提案された手法は、異なる気候状況下でもデータを一貫してモデリングしました。ここで構築されたデータ駆動型モードは、通常の状態と台風の状態の下で同様の補正パフォーマンスを示すため、強靭で汎化性があります。チームは、将来の調査で、風場に影響を与える他の変数(温度、気圧、湿度など)をモデルに組み込む予定です。

気象パターンを使用した風力発電所の電力予測と下流の尾流予測

ECMWF、ボン、インペリアルカレッジロンドン、UK気象庁エクセター、シェルリサーチ社による新たな研究は、複雑な数値天気予測モデルを非教師付きクラスタリングアルゴリズムと統合することで、風力発電所の長期予測と下流の尾流の正確な予測を効率的に行う新しい風力エネルギーワークフローを実証しました。この手順は、ERA5再解析データにおける気象トレンドを特定するために、非教師付きのk-meansクラスタリングを使用します。クラスタの平均気象条件を使用して、クラスタの電力出力と下流の風力発電所の尾流を計算するために、WRFシミュレーションが行われます。

この分析では、風力エネルギー生産の気象パターンの最適な変数とドメインサイズを決定します。WRFシミュレーションの実行後、チームはクラスタシミュレーションに独自の事後処理アプローチを適用して、長期的な風力発電所の出力と下流の尾流の予測を改善しました。この新しい手法により、シミュレーションを実行せずに、海上風力発電所の電力と下流の尾流の数年から数十年にわたる推定が可能となります。従来の研究では、下流の風力発電所の尾流の小規模な調査が行われてきましたが、このツールは、精度と迅速な長期予測を提供することで、これらの尾流を緩和するための初めてのツールです。

この手法を2つの事例研究地域に適用することで、提案された長期予測がWRFシミュレーション1年分と非常に一致することを示しています。風速によるグループ分けでは、結果が最も正確です。

GraphCast:効率的なVoAGI-Rangeグローバル天気予報の提供

ハリケーンの場合の服装の選び方から何をすべきかまで、人々は常に天気予報に基づいて計画を調整しています。人々は、将来10日間の天気に関する知識が必要な意思決定のために、気象サービスが1日最大4回発行する「VoAGI-range」の天気予報に頼っています。

DeepMindとGoogleによる最近の研究では、GraphCastが紹介されました。この新しいMLベースの気象シミュレータは、世界で最も正確な決定論的な運用VoAGI範囲の天気予報システムとすべてのMLベースラインを上回っています。GraphCastの自己回帰モデルは、ヨーロッパ気象予報センター(ECMWF)のVoAGI範囲天気予報のためのERA5再解析アーカイブの気象データを使用してトレーニングされています。このモデルは、ニューラルグラフネットワークと新しい高解像度の多スケールメッシュ表現に基づいて構築されています。赤道付近で約25×25キロメートルの解像度を持ち、5つの表面と6つの大気変数、それぞれ37の垂直圧力レベルで6時間ごとに10日間の予測を作成することができます。

2760の変数とリードタイムの組み合わせのうち、90.0%でGraphCastはECMWFの決定論的な運用予報手法であるHRESを上回りました。252のターゲットのうち99.2%で、GraphCastは最も正確な以前のMLベースの天気予測モデルを上回りました。Cloud TPU v4テクノロジーを使用するGraphCastは、35 GBのデータの10日間の予測を60秒未満で生成することができます。

従来の予測技術とは異なり、MLベースの予測は追加のデータがトレーニングに使用可能になると簡単にサイズと洗練度を増やすことができます。この研究は、MLベースの気象モデリングにおける重要な進歩です。原則として、これはさまざまな気象要因や季節および気候予測、野火、森林破壊など、より広範な環境および他の地理空間時間的な予測課題に適用することができます。

衛星データからの降水予測のためのWeatherFusionNet

最近、深層学習手法により天気予測の精度が向上しています。チェコ工科大学の研究者は、2021年のAI for Good World Summit Challengeで極端な気象現象の予測を行うための2つの深層学習モデルを発表しました。

最初のモデルであるsat2radは、U-Netベースの深層学習モデルであり、現在の衛星フレームの時間ステップでの降水量を推定します。このモデルは、異なるエリアのレーダーデータが利用可能な場合でも、畳み込みニューラルネットワークの空間不変性を使用して、全衛星領域の降水量を予測します。sat2radモデルは、4つの衛星フレームすべてに別々に適用され、4つのチャネルを生成します。

2番目のモデルであるPhyDNetは、物理的なダイナミクスと補足ビジュアル入力を分離する再帰型畳み込みネットワークです。PhyDNetの2つのブランチは、物理的なダイナミクスと将来の予測のための残差情報を処理します。競技の制限により、PhyDNetはレーダーフレームの代わりに衛星データでトレーニングされました。予測を行うために、別のU-Netが両モデルの出力を入力シーケンスとマージします。

この研究では、sat2radとPhyDNetモデルの使用により降水量の予測が向上することが示されました。畳み込みニューラルネットワークの空間不変性は、レーダーデータがより小さな領域にしか利用できない場合でも、全衛星領域の降水量を推定するのに役立ちました。

WF-UNet:降水量の即時予測のためのWeather Fusion UNet

都市の洪水や地滑りなどの重大な天候とその影響のための早期警戒システムを設計する際には、正確な短期予測(nowcasts)が必要です。農業管理から航空安全の向上まで、nowcastingのためのさまざまな環境的な用途があります。

マーストリヒト大学とユトレヒト大学の共同研究では、UNetコアモデルとその拡張を使用して、西ヨーロッパで最大3時間先までの降水量を予測することの実現可能性を探求しています。彼らの研究では、Weather Fusion UNet(WF-UNet)モデルを提案しています。これはCore 3D-UNetモデルを基にしており、風速や降水量などの変数をトレーニングプロセスに組み込み、これらの要素が降水量の予測という目的タスクの性能にどのように影響するかを分析します。

チームは、欧州連合の地球観測プログラムであるCopernicusのERA5データセットを使用して、14のヨーロッパ諸国全体で6年間(2016年1月から2021年12月まで)の降水と風のレーダー画像を編集しました。時間の解像度は1時間、空間の解像度は31平方キロメートルです。彼らは、提案されたWF-UNetモデルを持続モデルや単一の降水レーダー入力データでトレーニングされた他のUNetベースのアーキテクチャと比較して評価しました。調査結果によると、時間の範囲が1時間、2時間、および3時間の場合、WF-UNetは他の最も優れた設計と比較して、それぞれ22%、8%、および6%低いMSEを達成しました。従来のUNetモデルと比較して、意思決定レベルの融合は、アーカイブされたレーダー画像に含まれる時空間情報をキャプチャする能力に優れています。WF-UNetは、その優れた特徴抽出能力により、他のテストされたUNetベースのモデルよりも短期nowcastingで優れた性能を発揮します。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AIニュース

FitBot — フィットネスチャットボットエージェント

健康意識が最前線にあり、バランスの取れたライフスタイルの追求が普遍的な願望となっている時代において、栄養は間違いなく...

データサイエンス

「二つの頭を持つ分類器の使用例」

実際のコンピュータビジョンタスクの実例について話しましょう初めて見ると、分類問題は非常に単純ですが、それは一部当ては...

機械学習

自然言語処理:AIを通じて人間のコミュニケーションの力を解き放つ

この記事では、NLPの理解と進化について取り上げますAIがコミュニケーションの世界にどのように貢献できるかを学びましょう

機械学習

AWS Inferentiaでのディープラーニングトレーニング

この投稿のトピックは、AWSの自社開発AIチップ、AWS Inferentia、より具体的には第2世代のAWS Inferentia2ですこれは、昨年の...

AIニュース

「InstagramがAIによって生成されたコンテンツにラベルを付けるようになりました」

人気のあるソーシャルメディアアプリInstagramは、プラットフォーム上のコンテンツを認識する方法を革新する画期的な機能を開...

機械学習

「機械学習が間違いを comitte たとき、それはどういう意味ですか?」

「ML/AIに関する議論で、私たちの通常の「ミステイク(間違い)」の定義は意味をなすでしょうか?もしそうでない場合、なぜで...