「DALL·E 3はどのように作られましたか?(OpenAIの最高のテキストから画像を生成するモデル)」
「DALL·E 3の作成過程を詳しく解説!(OpenAIの画像生成モデルについて)」
キャプションを改善して画像生成を向上させる
louisbouchard.aiで最初に公開され、2日前に私のブログで読むことができます。
動画を見る:
昨年、OpenAIによる初の驚くべきテキストからイメージを生成するモデル、DALL·E 2に驚かされました。しかし、今日はその第三バージョンによって、芸術と技術がこれまで以上に融合した世界に足を踏み入れる準備をしてください!
OpenAIが最近公開した新しい論文で、DALL·E 3にダイブして、DALL·E 2から大きく進化した点を明らかにしましょう!
DALL·E 3の優位性の中核には、強力なイメージキャプションがあります。すべてはイメージキャプションにかかっています。トレーニング中にテキストは供給され、生成するべき画像とともに与えられます。この新しいイメージキャプションは、DALLE 3がDALLE 2よりも優れている主要な要因です。以前のモデルは、インターネットから取り込まれた画像とテキストのペアを使用して、自己教師ありの方法で最初にトレーニングされました。Instagramの写真とそのキャプションやハッシュタグを想像してみてください。いつもそれが情報提供的なものや関連性があるものとは限りません。投稿の著者は、主題に関する説明のみを行い、画像に現れる環境やテキスト、および主題以外の全体のストーリーについて説明しません。さらに悪いことに、多くのキャプションはただのジョークや関係のない考えや詩です。この段階では、そのようなトレーニングでは…
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles