「OpenAIが著者の許可なく彼らの著書を使用してChatGPTをトレーニングするために訴えられる」

OpenAIが著者の許可なくChatGPTをトレーニングするために訴えられる

2人の著者がOpenAIに対して訴訟を起こし、同社が彼らの作品をChatGPTのトレーニングに使用したと主張しています。問題は、彼らの書籍が著作権で保護されていたことであり、著者らはOpenAIがその作品をLLMのトレーニングに使用するための同意を得ていなかったと主張しています。

著者のPaul TremblayとMona Awardは、ChatGPTが彼らの作品に関して「非常に正確な要約」を生成できると主張しています。彼らは、これらの要約が彼らの作品に基づいてトレーニングされたChatGPTでのみ「可能」だったと述べており、これを著作権法の違反と見ています。

訴訟を提起したOpenAIと著者の両方の弁護士はCNBCの質問に対して回答していません。ChatGPTなどのLLMがトレーニングする方法は、通常、インターネットをクロールして収集される大量のテキストデータによって行われます。これには、ウィキペディアやアーカイブされた書籍などのサイトも含まれます。

訴訟はサンフランシスコで提起され、OpenAIのトレーニングデータの「大部分」が著作権で保護された資料に基づいていると主張しています。もちろん、これには2人の著者の書籍も含まれます。しかし、この訴訟の主な問題は、ChatGPTがどのようにしてデータを取得し、トレーニングしたのかを証明することです。

したがって、この情報がないと被害の証拠を示すことは困難な場合があります。現時点では、訴状はChatGPTが生成できた要約の展示物を参照しています。また、LLMが情報を間違えることも指摘しています。しかし、2人の著者は、要約の大部分が正確であり、彼らの主張では「ChatGPTはトレーニングデータセットの特定の作品の知識を保持している」と述べています。

訴状はさらに、「ChatGPTは、原告が公開した作品に含まれる著作権管理情報を一切再生産していない」と述べています。この訴訟は、芸術家の場合と非常に似ています。昨年、Stable DiffusionやDALL-E 2などのAIツールが、同意なしに彼らの作品をトレーニングすると主張する芸術家からの圧力がありました。

訴訟が進展するまでには時間がかかるでしょう。そして、裁判所での判断が将来のLLMのトレーニング方法を変える可能性があります。

編集者注：最新の生成AIについて学びたいですか？1日限りのGenerative AIサミットに参加しましょう。ハイプを超えて、この最先端の技術に深く潜り込みましょう。今すぐ無料で登録し、生成AIの力を解き放ちましょう。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Was this article helpful?

93 out of 132 found this helpful

「OpenAIが著者の許可なく彼らの著書を使用してChatGPTをトレーニングするために訴えられる」

Was this article helpful?

「機械学習を使ってイタリアのファンタジーフットボールで勝利した方法」

「ChatGPTは私たちを出し抜いているのか？チューリングテストの視点からの探求」

AIニュース

Google DeepMindは、直接報酬微調整（DRaFT）を導入しました：微分可能な報酬関数を最大化するための効果的な人工知能手法における拡散モデルの微調整

「Würstchenをご紹介します：高速かつ効率的な拡散モデルで、テキスト条件付きコンポーネントは画像の高圧縮潜在空間で動作します」

「Amazon SageMaker JumpStartでMistral 7Bを調整して展開する」

マイクロソフトは、エンタープライズ向けにカスタマイズされたAzure ChatGPTを発表しました

「LegalBenchとは：英語の大規模言語モデルにおける法的推論を評価するための共同構築されたオープンソースAIベンチマークです」

「研究者たちが、チップベースのサーミオニック冷却を量子コンピュータに応用可能にしました」