中国の研究者たちは、データプライバシーを保護しながらスクリーニングを改善するために、フェデレーテッドラーニング(FL)に基づく新しいμXRD画像スクリーニング方法を提案しました

Chinese researchers proposed a new μXRD image screening method based on Federated Learning (FL) to improve screening while protecting data privacy.

フェデレーテッドラーニングは、データを解放し、誰もデータを見たりアクセスしたりすることなくAIモデルをトレーニングすることで、新しいAIアプリケーションを駆動するメカニズムを提供します。産業鉱物は、結晶性と可能な不純物に関してその結晶の不純物を決定するために、シンクロトロンX線マイクロ回折(XRD)サービスによってサービスされます。XRDサービスは膨大な数の写真を生成します。これらの画像は、さらに処理および格納される前にフィルタリングする必要があります。サービスユーザーが自分たちの元の実験写真を提供することに対する抵抗感から、スクリーニングモデルをトレーニングするための効率的なラベル付けされた例が十分にありません。スクリーニングを強化するために、データのプライバシーを保持しながら、この研究ではフェデレーテッドラーニング(FL)ベースのXRD画像スクリーニングアプローチが提案されています。先進的なクライアントサンプリングアルゴリズムの支援を受けて、彼らの解決策は、さまざまな種類と量のサンプルを使用するサービスユーザーが直面するデータの分布の不均衡の問題に対処します。彼らはまた、FLクライアントとサーバー間の非同期データ交換に対処するためのハイブリッドトレーニング技術を提案しています。研究の結果は、彼らの技術が商業的に機密情報を保護しながら、産業材料のテストを行う商業顧客に対して効率的なスクリーニングを保証する可能性があることを示しています。

産業鉱物は、シンクロトロンX線マイクロ回折(XRD)を使用して結晶の不完全性を検出することができます。しかし、正確なXRD画像スクリーニングの進展は、2つの重要な問題によって妨げられています。1つは、ラベル付けされた産業サンプルの不足であり、もう1つは産業XRDサービスユーザーのプライバシー上の懸念です。

研究者は、ドメイン固有の物理情報を使用してフェデレーテッドラーニングの精度を向上させるための方法を開発しました。そして、現実世界のデータ分布の不均衡を考慮した新しいクライアントサンプリングアルゴリズムを使用したサンプリング方法を実装しました。FLクライアントとサーバー間の不安定な通信環境に対処するために、ハイブリッドトレーニングアーキテクチャも開発されました。

詳細なテストの結果、商業的に機密情報を損なうことなくユーザーやアプリケーション間でデータ特性を共有することで、機械学習モデルの精度が14%から25%向上しました。この革新的なシステムのフェデレーテッドラーニング機能は、データ交換における非技術的な障壁を取り除くのに役立ちます。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more