「MITの研究者が、おそらくほぼ正確な(PAC)プライバシーによる機械学習モデルのプライバシー保護において、ブレークスルーを達成」

MITの研究者が、PACプライバシーによる機械学習モデルのプライバシー保護において、ブレークスルーを達成

MITの研究者たちは、機械学習モデル内にエンコードされた機微なデータを保護するという課題について、大きな進歩を遂げました。科学者のチームは、肺スキャン画像から患者ががんを持っているかどうかを正確に予測できる機械学習モデルを開発しました。しかし、このモデルを世界中の病院と共有することは、悪意のある者によるデータ抽出の重大なリスクを伴います。この問題に対処するため、研究者たちは、PACプライバシーという新しいプライバシーメトリックを導入し、機微なデータを保護するために必要な最小限のノイズを決定するフレームワークを開発しました。

従来のプライバシーアプローチ(ディファレンシャルプライバシーなど)は、大量のノイズを追加することで特定のデータの使用を区別できなくすることに焦点を当てていますが、これによりモデルの精度が低下します。PACプライバシーは、ノイズが追加された後も、敵対者が機微なデータの一部を再構築する難しさを評価するという異なる視点を持っています。たとえば、もし機微なデータが人間の顔である場合、ディファレンシャルプライバシーは敵対者がデータセット内の特定の個人の顔を特定することを防ぎます。一方、PACプライバシーは、敵対者が特定の個人の顔として認識できる近似のシルエットを抽出できるかどうかを探求します。

PACプライバシーを実装するために、研究者たちは、モデルに追加する最適なノイズの量を決定するアルゴリズムを開発しました。このアルゴリズムは、敵対者の視点から元のデータの不確実性またはエントロピーに依存しています。データをサブサンプリングし、機械学習のトレーニングアルゴリズムを複数回実行することで、アルゴリズムは異なる出力間の分散を比較し、必要なノイズの量を決定します。分散が小さいほど、より少ないノイズが必要とされます。

PACプライバシーアルゴリズムの主な利点の1つは、モデルの内部動作やトレーニングプロセスの知識を必要としないことです。ユーザーは、敵対者が機微なデータを再構築する能力に関する所望の信頼レベルを指定し、アルゴリズムはその目標を達成するための最適なノイズの量を提供します。ただし、アルゴリズムはモデルにノイズを追加することによる精度の損失を推定しません。さらに、PACプライバシーを実装することは、さまざまなサブサンプリングされたデータセットでの繰り返しトレーニングにより、計算上の負荷が高くなる可能性があります。

PACプライバシーを強化するために、研究者たちは、サブサンプルの出力間の分散を減少させることで安定性を高める機械学習のトレーニングプロセスを変更することを提案しています。このアプローチにより、アルゴリズムの計算上の負担が軽減され、必要なノイズの量が最小限に抑えられます。さらに、より安定したモデルは一般化エラーが低くなり、新しいデータに対するより正確な予測が可能となります。

研究者たちは、安定性、プライバシー、および一般化エラーの関係についてさらなる探索が必要であることを認識していますが、彼らの研究は、機械学習モデルにおける機微なデータの保護に向けた有望な一歩を示しています。PACプライバシーを活用することで、エンジニアは実世界のアプリケーションにおいても精度を維持しながらトレーニングデータを保護するモデルを開発することができます。必要なノイズの量を大幅に削減する可能性があるため、この技術は医療分野やその他の分野での安全なデータ共有の新たな可能性を開拓します。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

「思考の連鎖を自動化する:AIが自身に推論を促す方法」

Auto-CoTのプロンプト手法は、多様性に基づくサンプリングとゼロショット生成を使用して、LLMsが複雑な推論を促すために自ら...

機械学習

Google AIが教育環境でのオーディオブックに対するソーシャル意識を持つ時間的因果関係を考慮したレコメンダーシステム「STUDY」を紹介します

読書は、言語能力や生活スキルの向上から感情の健康に至るまで、若い学生に大きな利益をもたらします。読書の楽しみと学業の...

機械学習

「機械学習の方法の比較:従来の方法と費用削減の代替方法 - 本当に効果があるのはどれか?」

人工知能は、クラウドプラットフォーム、金融、量的金融、製品設計など、さまざまな分野で日々大きく進化しています。多くの...

機械学習

「生成AIの余波におけるオープンソースAIの戦い」

テックジャイアントやAI実践者がリスクと報酬を考慮しながら、オープンソースAIの議論の進化する性質について学びましょう

コンピュータサイエンス

ChatGPT' の邪悪な双子 'WormGPT' が、黙ってメールに侵入し、銀行を襲撃しています

「SlashNextは、WormGPTが言語生成AIモデルの脅威の例であると述べています」

AIニュース

新しいZeroscope v2モデルに会ってください:モダンなグラフィックカード上で動作する無料のテキストからビデオへのモデル

前例のない一連の出来事の中で、次世代のオープンソースAIモデルであるZeroscopeが市場に登場しました。このモデルは、比較的...