「OpenAIが著者の許可なく彼らの著書を使用してChatGPTをトレーニングするために訴えられる」
OpenAIが著者の許可なくChatGPTをトレーニングするために訴えられる
2人の著者がOpenAIに対して訴訟を起こし、同社が彼らの作品をChatGPTのトレーニングに使用したと主張しています。問題は、彼らの書籍が著作権で保護されていたことであり、著者らはOpenAIがその作品をLLMのトレーニングに使用するための同意を得ていなかったと主張しています。
著者のPaul TremblayとMona Awardは、ChatGPTが彼らの作品に関して「非常に正確な要約」を生成できると主張しています。彼らは、これらの要約が彼らの作品に基づいてトレーニングされたChatGPTでのみ「可能」だったと述べており、これを著作権法の違反と見ています。
訴訟を提起したOpenAIと著者の両方の弁護士はCNBCの質問に対して回答していません。ChatGPTなどのLLMがトレーニングする方法は、通常、インターネットをクロールして収集される大量のテキストデータによって行われます。これには、ウィキペディアやアーカイブされた書籍などのサイトも含まれます。
- AI/DLの最新トレンドを探る:メタバースから量子コンピューティングまで
- ChatGPTコードインタープリタープラグインの使用方法10選
- AIを使用して、自分の目で直接拡張現実(AR)を体験してみましょう
訴訟はサンフランシスコで提起され、OpenAIのトレーニングデータの「大部分」が著作権で保護された資料に基づいていると主張しています。もちろん、これには2人の著者の書籍も含まれます。しかし、この訴訟の主な問題は、ChatGPTがどのようにしてデータを取得し、トレーニングしたのかを証明することです。
したがって、この情報がないと被害の証拠を示すことは困難な場合があります。現時点では、訴状はChatGPTが生成できた要約の展示物を参照しています。また、LLMが情報を間違えることも指摘しています。しかし、2人の著者は、要約の大部分が正確であり、彼らの主張では「ChatGPTはトレーニングデータセットの特定の作品の知識を保持している」と述べています。
訴状はさらに、「ChatGPTは、原告が公開した作品に含まれる著作権管理情報を一切再生産していない」と述べています。この訴訟は、芸術家の場合と非常に似ています。昨年、Stable DiffusionやDALL-E 2などのAIツールが、同意なしに彼らの作品をトレーニングすると主張する芸術家からの圧力がありました。
訴訟が進展するまでには時間がかかるでしょう。そして、裁判所での判断が将来のLLMのトレーニング方法を変える可能性があります。
編集者注:最新の生成AIについて学びたいですか?1日限りのGenerative AIサミットに参加しましょう。ハイプを超えて、この最先端の技術に深く潜り込みましょう。今すぐ無料で登録し、生成AIの力を解き放ちましょう。
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles