「Googleは、データの不適切な使用によるLLMの訓練を訴えられています」
Google is being sued for improper use of data in LLM training.
グーグルは新たな訴訟に直面し、自社のAI製品に力を与えるLarge Language Modelsを訓練するために個人データを不正に使用しているという非難を受けています。この訴訟は、テックジャイアントがユーザーの同意なしに数百万人のデータをスクレイピングし、その過程で著作権法を違反していると主張しています。
この訴訟は、親会社のアルファベットとDeepMindも対象とします。Clarkson Law Firmという法律事務所は、先月OpenAIのChatGPTメーカーに対して同様の訴訟を起こし、カリフォルニアの連邦裁判所に提訴しました。この訴訟は、Googleが「数百万人のアメリカ人がインターネット上で作成し共有したものを秘密裏に盗んでいる」と主張しています。
また、この訴訟では、Bardなどの製品もそのデータで訓練されたと主張しています。しかし、訴訟はさらに進んでいます。それはまた、Googleが「私たちのデジタルフットプリントのほぼ全体」を持っていると主張しています。これにはもちろん、「創造的で著作権のある作品」も含まれており、それらを基にAI製品を構築しているということです。
CNNに対する声明で、Googleの総顧問であるHalimah DeLaine Prado氏は、訴訟によって主張された主張を「根拠のないもの」と呼びました。彼は続けて、「数年にわたり、GoogleがGoogle Translateなどのサービスの背後にあるAIモデルを訓練するために、公開された情報(オープンウェブに公開された情報や公開データセットなど)を責任を持って使用していることを明確にしてきました」と述べました。
Halimah DeLaine Prado氏は、使用法を規制する既存の判例を指摘し続け、「アメリカの法律は公開情報を使用して新しい有益な用途を作成することを支持しており、これらの根拠のない主張を反証することを楽しみにしています」と述べました。
ワールドワイドウェブからの情報スクレイプがAIモデルの訓練に使用される問題は数ヶ月間 simmering(枯れ続ける)状態にありました。これはAIパワードツールや製品が市場で爆発的に増加するにつれてエスカレートしています。著作権、プライバシーなどに関連する問題は、責任あるAIについて議論する中でますます重要な懸念事項となっています。
Clarksonの弁護士の一人であるTim Giordano氏はCNNに対して、「グーグルは『公開可能』は何の目的でも無料で使用できることを意味しないことを理解する必要があります。私たちの個人情報やデータは私たちの財産であり、価値があり、誰もそれをただ取って好きな目的で使用する権利はありません。」と語りました。
Giordano氏はまた、グーグルの検索インデックスと、モデルの訓練にデータを取り込む方法の違いを明確にしました。彼は検索インデックスについて、「あなたの作品への属性付きリンクを提供でき、実際にそれを購入するかそれに関与することができる」と述べました。一方でスクレイピングについては、「作品の代替バージョンであり、誰もが作品を購入する必要性を根本的に変えるインセンティブを与えるものである」と述べました。
訴訟がGoogleから求めているのは、Googleの生成型AIツールへの商業アクセスと商業開発の一時停止です。もしこの差し止めが認められれば、グーグルの2023年のAI拡大計画は保留となる可能性があります。
この訴訟はまた、同社がGoogleが誤用したと主張する人々に対する未特定の損害賠償と支払いを要求しています。
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles