AIによって生成された合成データ

AI生成の合成データ

最良の方法を猫とともに説明します!

なぜAIによって生成される合成データが最近注目されているのでしょうか?この記事では、私のお気に入りの方法である猫とともに説明します!

例えば、私がゼロから猫と非猫の分類器を訓練したいとしますが、使える写真は1枚だけです:

筆者の猫、ハクスリー。

(以下の内容は、表形式データやテキストデータに対して人々が行うことのたとえであり、画像データに限定されません。)

理想的には、数千枚の猫の写真と非猫の写真から成るデータセットが必要になります。カメラと十分な猫へのアクセス権がある場合、既に持っている写真と同様の写真をたくさん撮ることで、設計したデータセットを正確に取得することができます:

イスタンブールの公園で撮った写真。

しかし、カメラがなく、月に住んでいる場合はどうでしょうか?ベンダーから必要な画像を入手することもできますが、継承データは元データよりも危険性が高いため注意が必要です。

無料で素晴らしい猫の写真を提供してくれるPixabayさんに感謝します。

しかし、猫の写真を販売してくれるベンダーがいない場合はどうでしょうか?(はい、インターネット上の猫の写真がなくなるという状況は、月に住むよりもSF的なものですが、お付き合いください。)

そうなると、収集することも買うこともできないため、自分で作成するしかありません。これが私の創造物です:

筆者はまさにミケランジェロです。

うまくいかない?そうですね、絵を描くのは得意ではありませんでした。フェイクデータを作成する別の方法は、既存のデータポイントをコピーすることですが、これは教育的なバラエティを提供するのにはあまり役に立ちません。

この方法では誰も騙されません。実質的には1つのデータポイントしか持っていません。

これでは、同じ例を何度も与えることで人間の学生に教えるのと同じで、彼らが学ぶのはその一つのことだけです。もし私のデータセットがこのハクスリーの写真の30,000のコピーであるならば…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more