ダリー3がChatGPTの統合を持ってここに登場しました

ダリー3、ChatGPTとの統合でここに登場！

スポンサードコンテンツ

テクノロジーやAIについて追いかけているなら、画像生成に関しては、Midjourneyがみんなのお気に入りです。しかし、今は競争相手も出現しています。ジェネラティブAIが一山越え、OpenAIが2023年9月20日にDALL·E 3という画像生成モデルを公開しました。

素晴らしいブログを書いたら、それに合う画像がほしいと思ったことはありませんか？カッコいいアイデアが浮かんだけれど、それをビジュアルで表現したかったことはありませんか？自分で画像を作る気力がなく、ただ即座に欲しかったことはありませんか？さらに、それが自分が想像したまさにそのものだったら、最高ですね。DALL·E 3なら、すべてが可能です。

DALL·E 3とは？

まずは最初から説明しましょう。DALL·Eは、OpenAIが深層学習を用いて開発したテキストから画像を生成するモデルです。DALL·E 2で自然言語処理を用いたデジタル画像の生成が可能でしたが、今ではDALL·E 3が登場しました。

DALL·E 3は、今まで以上に細部にまでこだわり、微細なニュアンスやディテールを理解する能力を備えています。新たに追加された「プロンプト」を使用して、アイデアを正確なデジタル画像に簡単に変換できます。

DALL·E 2とDALL·E 3

では、二つの違いは何でしょうか？DALL·E 3はどうしても前回よりも優れているのでしょうか？

文脈をより理解できる

DALL·E 2とDALL·E 3の主な違いは、モデルが文脈を理解する能力です。DALL·E 2は、特定の語句を指示されても文脈を完全に理解するのが難しく、具体的な単語を無視することがありました。DALL·E 3は文脈をより良く理解し、ユーザーが望む画像を提供します。

ChatGPTと連携

DALL·E 3は、特にChatGPT上で構築されています。これにより、DALL·E 3とChatGPTを併用してアイデアのブレインストーミングやプロンプトの緻密化ができます。DALL·E 3にアイデアを与えると、ChatGPTがユニークで細かく詳細なプロンプトを生成し、DALL·E 3がそれを具現化します。

DALL·E 3が生成した画像が気に入らない場合、ChatGPTにさらなる調整を依頼して自分の希望通りの画像にすることができます。

画像はあなたのものです！

DALL·E 2で作成された画像は、作成したユーザーのものではありませんでした。しかし、DALL·E 3で作成した画像はすべてあなたのものです！つまり、OpenAIの許可なしにそれらを転載したり、販売したり、商品化したりする必要はありません。興味深い進展ですね。

生存するアーティストの模倣

“生存するアーティストの模倣は問題がある”という問題には触れませんが、すぐにうっぷんがたまることはわかっています。訴訟問題、著作権の侵害など、お察しいただけるでしょう。

OpenAIの代表者は、DALL·E 3は生存するアーティストのスタイルを模倣する画像の生成を拒否するように訓練されていると語りました。一方、現在のDALL·E 2は特定のアーティストの画風を模倣するように指示することができます。アーティストが満足するために、OpenAIはまた、将来のモデルの訓練に使用するための画像を作成者が選択できるよう提供しています。

フェイク画像生成

DALL·E 3について学んだことからは、それはまるでオープンな遊び場のようなもののようです。しかし、OpenAIはまだ全ての生成AIツールの使用において安全性について非常に厳しいです。OpenAIは、DALL·E 2と同様、DALL·E 3には有害な、暴力的な、性的なコンテンツの生成能力を制限するキーワードと画像の検出フィルターが実装されていると述べています。Midjourneyがドナルド・トランプの逮捕画像のフェイクを生成した際にこれがすでに起こったのを見ています。

以下の画像を見てください。これは『バスケットボール選手がスラムダンクし、星雲の爆発として描かれた表情豊かな油絵』というプロンプトを使用して画像生成を行った場合、DALL·E 2とDALL·E 3の出力の違いを示しています。

ChatGPT ProでのDALL·E 3の使用

DALL·E 3は最近ChatGPT Proでも導入され、OpenAI APIやLabsへの可用性も近日提供予定です。

ChatGPT ProからDALL·E 3を使用するには、馴染みのあるチャットインターフェースを介してサービスと対話する利便性がありますので、ChatGPTのウェブサイトにアクセスし、ChatGPT-4のメニューオプションから「DALL·E 3（ベータ）」を選択してください。

これで、通常どおりChatGPTと対話するだけで済みます。

山岳地帯の冬景色で、小屋とヤギを含んだ画像を作成してください

そして、こちらがDALL·E 3がChatGPTインタフェース内で生成し出力するものです。

Image by Author using DALL·E 3（クリックして拡大）

これほど簡単です。ChatGPTがDALL·Eに使用するための有用なプロンプトを工学的に作成します。その他のオプションでは最高の結果を得るために巧妙なプロンプトエンジニアリングが必要です。

まとめ

それが現時点のDALL·E 3です。このことは、MidjourneyやStabilityAIなどの他のAI画像生成競合製品にとってどのような意味を持つでしょうか。

ご意見をコメントでお知らせください。

****【ニシャ・アリア】(https://www.linkedin.com/in/nisha-arya-ahmed/)****はデータサイエンティストであり、フリーランスの技術ライターです。彼女は主にデータサイエンスのキャリアアドバイスやチュートリアル、理論に基づいたデータサイエンスの知識を提供することに興味を持っています。また、人間の寿命の延長に人工知能がどのように役立つかを探求したいと思っています。彼女は積極的な学習者であり、自身の技術知識とライティングスキルを広げながら、他の人をガイドすることを助けたいと考えています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Artificial Intelligence

Was this article helpful?

93 out of 132 found this helpful

ダリー3がChatGPTの統合を持ってここに登場しました

DALL·E 3とは？

DALL·E 2とDALL·E 3

文脈をより理解できる

ChatGPTと連携

画像はあなたのものです！

生存するアーティストの模倣

フェイク画像生成

ChatGPT ProでのDALL·E 3の使用

まとめ

Was this article helpful?

「切り分けて学ぶ」による機械学習におけるオブジェクトの状態合成の認識と生成

プリンストンの研究者が、構造化プルーニングを介した言語モデルの事前トレーニングの加速のためのシャアドLLaMAモデルを紹介します

人工知能

「クリス・サレンス氏、CentralReachのCEO - インタビューシリーズ」

「ゲイリー・ヒュースティス、パワーハウスフォレンジクスのオーナー兼ディレクター- インタビューシリーズ」

スコット・スティーブンソン、スペルブックの共同創設者兼CEO- インタビューシリーズ

「ElaiのCEO＆共同創業者、Vitalii Romanchenkoについてのインタビューシリーズ」

「UVeyeの共同設立者兼CEO、アミール・ヘヴェルについてのインタビューシリーズ」

「LeanTaaSの創設者兼CEO、モハン・ギリダラダスによるインタビューシリーズ」