「風を継ぐ」

『風を継ぐ美とファッション』

Figuring out precisely how machine learning and artificial intelligence might improve upon classical numerical weather prediction models is still in its early stages. ¶ Credit: jkgeography.com — 機械学習と人工知能が古典的な数値気象予報モデルの改善にどのように貢献するかを正確に解き明かすことは、まだ初期段階にあります。 ¶ クレジット：jkgeography.com

「風のように自由」というフレーズは哲学的な意味では正確かもしれませんが、物理的な世界では風は常に自由ではありません。風を正確に予測することには、実際の経済的および人道的な影響があります。大気現象の大規模と小規模の間の原因と影響は、文字通りおよび比喩的にも同じ方程式の一部です。

人工知能（AI）と機械学習（ML）を気象に組み込む効果の研究は新しいものではありませんが、人工知能はまだ運用予測モデルに大きな進展をもたらしていません。それにもかかわらず、相対的な計算効率の良さ、既存の予測モデルよりもはるかに大きなデータセットをより速く実行できる能力は、気象学およびコンピュータ科学のコミュニティが重要な知識交差の時代に向けて準備していることを示しています。

気象の先端のML研究では、既存モデルの歴史的な再解析データに基づくトレーニングデータセットを新たな観測データと組み合わせることが行われています。MLを使用していないプロジェクトのデータであっても、将来のモデルに大きな利益をもたらす可能性があります。

ある伝統的なモデリングプロジェクトの一つでは、コロラド州立大学とアメリカ国立海洋大気庁の研究者は、米国で最も広く使用されているHigh-Resolution Rapid Refresh（HRRR）モデルの風の予測改善が、モデル更新期間中に更新されたHRRRモデルがあった場合、全国の実際の収入が $384 億ドル増加した可能性があることを発見しました。風の正確な予測は、公益事業リソースの効率的なスケジューリングに不可欠です。実際に発生する以上の風力エネルギーを予測すると、より高価な化石燃料ベースの発電への緊急切り替えが発生する可能性があります。逆に、風が少なすぎると、他の電力源の過剰スケジューリングが発生し、休息できる時間に電力を過剰に供給します。

これらのプロジェクトは「風予測改善プロジェクト」と呼ばれました。第1フェーズ、WFIP-1は2011年から2013年にかけて、グレートプレーンズとテキサス州西部からデータを収集しました。第2フェーズ、WFIP-2は2015年から2019年にかけて、オレゴン州とワシントン州の太平洋北西部にあるコロンビア川流域で実施されました。ただし、発見された節約を実現するためには、マイクロ気候要素のデータ収集と分析が欠かせませんでした。WFIP-2で作業しているチームは、例えば、風力タービンの高さで風速を正確に予測することが最も難しいのは、大気の最も低い部分にある「冷たいプール」によって複雑化することを発見しました。このプロジェクトでは、雲量がそれらの発生に大きな影響を与えることが明らかになりました。

「冷たいプールは、複数の理由で問題です」とNOAAの物理科学研究所の研究気象学者であるジム・ウィルザックは語ります。ウィルザック氏はWFIP-1のNOAA技術マネージャーおよびWFIP-2の観測リードとして務めました。彼は、「風力エネルギーにとっては問題です。非常に少ない風力エネルギー生産が行われます。大気質にとっても問題で、これらの谷間にいる場合、暖炉を使用して煙や微粒子を排出する車があり、それらが閉じ込められて、非常に汚染された密度の高い冷たい層が地面近くに形成されます」と述べました。

WFIPの研究は、従来の気象モデルである数値気象予測（NWP）モデルが、古典的な計算技術を使用して主に分析および修正されていた時代との分かれ目を示すかもしれません。WFIPの研究者が使用したNWPモデルは、そこに居場所での風の測定値や雲量などの要素を含めていない観測条件のデータを含んでいます。MLベースの気象予測の運用結果はまだ初期段階ですが、ウィルザック氏は状況が長く続くとは予想していません。

「WFIP-1やWFIP-2では、実際のNWPモデルの改善を厳密に試みただけで、機械学習はほとんど適用されていませんでした」と彼は言いました。「しかし、現在のNWPモデルの予測スキルを超えるまでに、機械学習モデルはあまり時間がかからないと思います。」

機械学習とAIが古典的なNWPモデルをどのように改善できるかを正確に把握することはまだ初期段階ですが、その技術の有望さはWilczakや他の人々にとっても明らかです。

例えば、Wilczakは、コロンビア川峡谷の冷たいプールのようなある地形のデータが、ニューヨーク州の丘の風力発電所での風の研究には限られた転用性しか持たないと述べました。

しかし、将来、世界中の同様の地形でMLを使用する研究者（または運用気象学者）は、そのような生のデータを再解析データと連携して使用することができるかもしれません。

「その意味では、WFIPなどのフィールドプログラムは、予測を改善しようとするためにMLアルゴリズムに組み込まれることができる測定結果を提供するために重要かもしれません」とWilczakは述べています。

そのようなデータを追加することは、計算的に高価である必要はありません。米国気象学会の2023年8月のバレットンに掲載された要約論文では、Paul J. RoebberとStephan Smithは、リアナリシスデータを使用してトレーニングされたディープラーニングモデルを使用し、単一のグラフィックス処理ユニットで数時間で85,800の再予測を生成した研究を指摘しています。

衛星とLLMによる研究

北半球の夏終わりから秋始めは、海に逸れたり壊滅的な上陸をするかわからない熱帯低気圧やハリケーンが形成されるピーク時です。2022年9月にフロリダに上陸したカテゴリー4のハリケーンイアンは、キューバと米国で160人の死者を出し、被害額は500-650億ドルでした。最も広く使用されている予測モデルの2つであるGFSとEuroは、嵐が陸地に襲来する場所について意見が分かれましたので、死者数は予想以上に多かった可能性があります。

2023年の最大のハリケーンの1つであるハリケーンリーは、同様に壊滅的で予測が困難な可能性がありました。南大西洋上で渦巻き、米国とカナダの東北海岸の広大な地域を脅かす可能性がありましたが、AI気象研究の先駆者たちは、自分たちの研究がそのような嵐の予測を容易にするかもしれないと通信に話しました。

「確かに、私たちの研究は、リーのようなハリケーンのデータ収集に役立つ可能性があります」とアリゾナ大学の気候動力学と水文気象センターのディレクターであるXubin Zengは、最近行った研究について述べました。彼と彼の研究チームは、赤外線衛星画像データを使用して、水蒸気の移動を利用して複数の高さでの風速を予測しました。研究の主著者である研究科学者のアミールオイードは、画像を処理するためにMLアルゴリズムを開発しました。気球からの測定値との比較では、彼らの手法による風の復元は既存の衛星風製品の誤差範囲内にあり、垂直解像度でこれらを上回るものでした。

「私たちのような研究が価値がある理由の一部は、「実際の観測データが海上では何もない」ことです」とZengは述べました。「そういうわけで、NOAAはハリケーンシーズンごとに航空機を送り出して測定するために非常に多額のお金を使っています。」

ヨーロッパの野心的な新しいマルチ機関のAIベースの気象予測試みであるAtmoRepの首席科学者であるクリスチャン・レッシグは、このような技術が厳しい天候の予測にとって本当に利益になるかもしれないと述べました。「ハリケーンがどこに行くかを正確に予測することはできないかもしれませんが、より良い確率予測を行うことはできます。AIモデルは従来のモデルよりも安価なため、より大きなアンサンブルを生成し、ハリケーンがどこに行くかのより良い確率を得ることができます。」

ZengとLessigのプロジェクトは、風の予測におけるAIの探求の陰と陽を表すかもしれません。Zengのチームは、与えられた垂直スタック内の可変高度の風のコンピュータビジョン補助予測のために比較的小さな画像を見ました。これは、運用予測に使用可能な天気計器では実用的ではなかったり不可能だったりするものです。新しい衛星の公転周期から50分ずれて同じ円を周回していたNOAAの衛星の寿命が延びたおかげで、Zengと彼のチームは差別化された画素化データを使用して水蒸気の移動を明らかにすることができました。それは風が水蒸気を動かす方法に影響を受けるため、人の目には見えません。

一方、AtmoRepは大規模言語モデル（LLM）の原則に触発されています。その作成者たちは、風を含むすべての大気力学を表現し説明するための1つの生成型ニューラルネットワークを訓練することを目標としています。そのモジュールの性質により、研究者や予報士は風や降水、気温などのさまざまな要素を取り出すことができます。しかし、そのようなモデルを構築することは非常に困難です。このモデルは、自然言語処理モデルよりもはるかに複雑なプロセスとデータセットに対処する必要があります。このモデルには35億のパラメータがあります。

AtmoRepは、ヨーロッパ気象庁（ECMWF）のERA5リアナライズデータセットを用いて訓練されています。これには、気温、気圧、風速などの大気パラメータの時間ごとの推定値が含まれています。また、降水量、土壌の湿度、海の波の高さ、海面温度などの地表パラメータも含まれており、1940年1月から現在までの期間をカバーしています。

AtmoRepは訓練データのバイアスを緩和するために、Wilczakの考えに従い、最新の観測データも使用することができます。AtmoRepチームは、プロジェクトの紹介（前回の改訂は9月初旬）で、ドイツの国立気象サービスからのRADKLIM降水レーダーデータを紹介しました。その結果、AtmoRepによる降水フィールドの範囲と形状は、元々のERA5データよりもRADKLIMにより近くなったことが示されました。

The-article-end-here

“Zengのような研究は、AtmoRepのようなニューラルネットワークに追加するために非常に有用である可能性があります。”

Lessigは言います。「機械学習の強みの1つは、さまざまなデータソースを統一されたニューラルネットワークモデルに結合することができる点です。例えば、さまざまなソースのテキストを訓練するLLMや、テキストと画像を抽象的な内部表現に組み合わせるテキスト-画像モデルなどがあります。したがって、再解析データとOuyedと彼の同僚が得たデータの訓練を組み合わせて相互に豊かにすることが想像できます」と彼は述べています。

Lessigは、Zengチームの画像の粗さ（1度、または100キロメートル）が、縮尺ダウン（大規模モデルデータをより小規模な空間スケールに変換する技術）においてその有用性を制約していると述べましたが、他の衛星測定値は1-5kmの解像度であり、地表測定システムは約10mの解像度で動作していると指摘しました。Lessigは、AtmoRepのコードをオープンソースにする意図が他の人々が貢献し、真のコミュニティモデルでデータとコードを入手することを奨励することを望んでいると述べました。

Zengの研究とWFIPプロジェクトは、そのようなコミュニティが自分自身を構築できる基盤となるかもしれません。Zengは、彼のチームの研究成果が将来の衛星ミッションの実現可能性を示しており、彼らは10kmの解像度を提供することを目指していると述べました。また、気象学と機械学習研究の相互交流が興味深い段階にあるとも付け加えました。

“私たちのグループは実際の技術の開発者ではありません。私たちはコンピュータサイエンスの分野からそれを利用しました。それが科学が機能する方法です。私たちはお互いから学び合います”

Gregory Gothは、科学と技術を専門とするOakville, CTを拠点とするライターです。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Artificial Intelligencecomputer applicationscomputer systemshuman-computer interaction

Was this article helpful?

93 out of 132 found this helpful

「風を継ぐ」

Was this article helpful?

「イギリスのテックフェスティバルが、クリエイティブ産業でAIを活用するスタートアップ企業を紹介する」

無料でニュースレターを成長させる4つの方法

AIニュース

メタのラマ2：商業利用のためのオープンソース言語モデルの革命化

「AIが秘密のメッセージをミームに隠し込む可能性」

アデプトAIラボは、Persimmon-8Bという強力なフルパーミッシブライセンスの言語モデルをオープンソース化しました

AI研究でα-CLIPが公開されましたターゲテッドアテンションと強化された制御によるマルチモーダル画像分析の向上

「ロボットのセンシングと移動のためのアルゴリズム」

「NYUとMeta AIの研究者は、ユーザーと展開されたモデルの間の自然な対話から学習し、追加の注釈なしで社会的な対話エージェントの改善を研究しています」