「OpenAIが著者に同意なく彼らの著書を使用してChatGPTをトレーニングするために訴えられる」
OpenAI sued for training ChatGPT using authors' books without permission.
2人の著者がOpenAIに対して訴訟を起こしました。彼らは、OpenAIが彼らの著作物をChatGPTのトレーニングに使用したと主張しています。問題は、彼らの本が著作権で保護されており、著者がOpenAIに彼らの作品をトレーニングに使用する許可を与えていなかったということです。
著者のポール・トレンブレイとモナ・アワードは、ChatGPTが彼らの作品の「非常に正確な要約」を生成できると主張しています。彼らはさらに、これらの要約はChatGPTが彼らの作品をトレーニングすることで「可能になった」と主張し、これを著作権法違反と見なしています。
OpenAIおよび訴訟を起こした著者の弁護士はCNBCの質問には回答していません。ChatGPTのようなLLMのトレーニング方法は、通常、インターネットをクロールして収集される膨大な量のテキストデータを使用して行われます。これにはWikipediaやアーカイブされた本などのサイトが含まれます。
- 「OpenAIがGPT-4へのアクセスを提供」
- 「ChatGPTは旧聞です:ここにはあなたの仕事を変革する8つのAIツールがあります」
- 「ODSC Europe 2023 キーノート:マイクロソフトのヘンク・ブーレマンによるAzureを用いたPyTorchモデルの展開」
この訴訟はサンフランシスコで提起され、OpenAIのトレーニングデータの「大部分」が著作権で保護された資料に基づいていると主張しています。もちろん、これには2人の著者の本も含まれます。ただし、このケースの大きな問題は、ChatGPTがデータをトレーニングする際に具体的にどのようにしてどこからデータを取得したのかを証明することです。
したがって、この情報なしに損害の証拠を示すことは困難となる可能性があります。現時点では、苦情はChatGPTが生成できた要約の展示物を参照しています。また、LLMが情報を誤っていることも指摘しています。しかし、2人の著者は、要約の大部分が正確であり、彼らの主張によれば、「ChatGPTはトレーニングデータセット内の特定の作品の知識を保持している」と述べています。
苦情はさらに述べています、「ChatGPTは、原告が公表した作品に含まれる著作権管理情報を再現することはありませんでした。」この苦情は、芸術家の苦情に非常に似ています。昨年、Stable DiffusionやDALL-E 2などのAIツールが、許可なく彼らの作品をトレーニングしたと主張する芸術家からの圧力がありました。
訴訟が進展するまでには時間がかかるでしょう。そして、裁判所での判断が将来のLLMのトレーニング方法に影響を与える可能性があります。
Editor’s Note: 最新の生成AIについて学びたいですか?1日限定のGenerative AIサミットに参加しましょう。ハイプを超えて、この最先端の技術に深く潜り込んでみましょう。今すぐ無料で登録し、生成AIの力を解き放ちましょう。
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- マイクロソフトのボスは、AIが支配することに懸念を抱いていない
- 「責任あるAIダッシュボードでオブジェクト検出モデルをデバッグする」
- Google Cloud上のサーバーレストランスフォーマーパイプラインへの私の旅
- パートナーシップ:Amazon SageMakerとHugging Face
- 分散トレーニング:🤗 TransformersとAmazon SageMakerを使用して、要約のためにBART/T5をトレーニングする
- Amazon SageMakerを使用して、Hugging Faceモデルを簡単にデプロイできます
- Hugging Face Transformers と Amazon SageMaker を使用して、GPT-J 6B を推論のためにデプロイします