ポーと一緒に蹴りの効いた中間プロンプト
ポーと一緒に蹴りの効いた中間プロンプト' can be condensed as '蹴りの効いた中間プロンプト
Poeは、統一されたインターフェースを通じて、数多くのチャットボットとLLM(Large Language Models)にアクセスするプラットフォームです。ChatGPTやLlamaなどの通常のLLMだけでなく、入力を絵文字に変換するカスタマイズされたチャットボット、あなたの質問に興味を持たないチャットボット、あなたがすることすべてを犯罪だと思うチャットボットなど、さまざまなカスタマイズされたチャットボットにもアクセスできます。このサイトには、無料と有料のプランがあります。PoeはQuoraによって作成されました。
Midjourneyは有料のAI画像生成サービスです。現在利用可能な中で最も能力があり、最高品質の生成された画像を提供するモデルと言えるでしょう。Midjourneyのプロンプトを完成させ、最良の結果を得るためには、しばしば多くの反復と時間がかかる芸術です。その部分でPoeが活躍します。
Poeで人気のあるボットの1つはMidjourneyボットです。このボットはMidjourneyモデルへのアクセスを提供するのではなく、ラフなプロンプトを入力として受け取り、最初から受け入れ可能な画像を生成するための書き換えを行います。
- 「クリス・サレンス氏、CentralReachのCEO – インタビューシリーズ」
- 「Hugging Face LLMツールの完全初心者ガイド」
- 「10個の最高のAIヘッドショットジェネレーター(2023年9月)」
この記事では、このプロセスのいくつかの反復を試し、結果を比較して、Poeボットが最初から画像を向上させるのにどのように役立つかを確認します。
これらの比較では、筆者は下記に示す比較のみを行い、各プロンプトに対して1回の画像生成を行い、結果の選りすぐりは一切行いませんでした。主観的な判断はすべて筆者自身によって行われました。なお、Poeが新しいプロンプトに追加したMidjourneyのパラメーターについては、同じ条件で比較するために追加されたものであることに注意してください。私は全てのプロンプトに--ar 16:9
を追加しました。16:9が唯一の受け入れ可能な画像の比率です。以上です。
エルサレム旧市街
まず、地球上で最も象徴的で簡単に識別できる場所の1つであるエルサレム旧市街から始めましょう。特定のランドマークにこだわらず、エルサレム旧市街の特徴的な外見を表す画像を求めています。
基本的なプロンプトと結果:
エルサレム旧市街の抽象的な芸術的描写–ar 16:9
Poeの支援を受けたプロンプトと結果:
エルサレム旧市街の抽象的な芸術的描写のカラーフォト。この作品は、古代都市の豊かな歴史と霊的な意味を捉えた、活気に満ちたダイナミックな解釈です。写真は大胆な筆遣いと鮮やかな色彩の連続を表現し、エネルギーと動きの感覚を引き起こします。狭い通り、古代の壁、賑やかな市場がすべて調和したカオスの中で結びついて、神秘的なオーラに包まれた環境が生まれます。カメラの設定は実験的で先駆的であり、伝統的な写真術の枠を超えています。Hasselblad X1D II 50CとLensbaby Velvet 56レンズを組み合わせ、クリエイティブなぼかし効果とソフトフォーカス効果を実現しています。二重露光技法と意図的なカメラの動きにより、画像に幻想的かつ夢幻的な質感が加わります。このシーンには、没入型のストーリーテリングで知られるビジョンのある映画監督、詩的な映像で有名な著名な映画撮影監督、超現実的で鮮やかな構図で有名な挑発的な写真家、未来的で彫刻的なデザインで有名な革新的なファッションデザイナーといった、予想外のコラボレータがいます –ar 16:9
まず、Poeが生成したプロンプトがどれだけ詳細かを見てみましょう。具体的な内容のいくつかに注目してください。また、「~のようなスタイルで」という物議を醸す表現にも注目してください。
さて、目隠しをしてもエルサレム旧市街の周りをある程度は歩き回ることができますが、生成された画像は実際の場所のどれとも一致しません。しかし、私たちはこの基準で生成された画像を判断することはできません。代わりに、芸術的な価値の主観的な基準を使用する必要があります。
注意:AIによって生成された画像について「芸術的な価値」(または「芸術的な何か」)という用語の使用に異議を唱えるかもしれませんが、私はこのシナリオで伝えたいことを最もよく表現する言葉だと考えています。不満ですか?「模倣された芸術的な価値」と書いたと想像してください。それでも不満ですか?まあ、AIによって生成された画像はここにあり、どこにも行きません。AI画像生成のプロセスと結果について合理的な人々がどのように議論するかについては意見の分かれるところですが、それはここでは議論したくありません。私は単に、AI画像生成のプロンプトを改善しようとする傾向のある人々がどのように試みるかを示しているだけです。
オリジナルの画像は、一見した後に私の注意を引くような興味深いイメージがなく、少し物足りないと感じます。ポーのアシストによる2回目は、カラフルで、一見以上の追加検査に値すると思います。美は見る人の目によって異なるので、意見は異なるでしょうが、私は両方の場合に右上の画像を「最も」代表的なものとして選びました。両方を拡大表示し、以下に共有します。
再度言いますが、これは完全に主観的なものですが、結局のところ、私はポーのプロンプトを使用した「最も」優れた結果に感銘を受けます。まとめると、オリジナルのプロンプトの画像よりも、ポーのプロンプトによる生成画像が良いと考えます。また、私のオリジナルのプロンプトの最良の努力よりも、ポーの最良の努力の方が優れていると思います。
プロフェッショナルヘッドショット
何か違うものを試してみましょう、人物を含むイメージです。プロフェッショナルなヘッドショットを生成しましょう。
シンプルなプロンプト:
通りでの女性のプロフェッショナルヘッドショット
これらをポーの拡張プロンプトと比較してみましょう:
通りでの女性のプロフェッショナルヘッドショットのカラーフォト。被写体は自信と優雅さを備えた女性で、都市の背景においてプロフェッショナリズムとエレガンスを放ちます。彼女のヘッドショットは彼女の輝く笑顔と温かい人柄を捉え、彼女の親しみやすさとプロフェッショナリズムを示しています。周囲の人々や交通のぼやけた背景とともに、彼女を焦点とした都市の賑やかな通りの環境が強調されています。カメラの設定は彼女の特徴を引き立て、彼女の本質を捉えるために慎重に選ばれています。Nikon D850と、ニコンAF-S NIKKOR 85mm f/1.4Gなどのポートレートレンズを組み合わせて、浅い被写界深度を実現し、魅力的なボケ効果を作り出しています。写真はバランスの取れた構図でフレーム化されており、周囲の建築物からのリーディングラインを活用して視覚的な興味を追加しています。このシーンの想定外の共同作業者としては、彼女の親密なストーリーテリングで知られる名だたる監督ソフィア・コッポラ、大気的な照明で称賛される著名な撮影監督ダリウス・コンジ、魅惑的な肖像写真で有名なアニー・リーボヴィッツ、そして永続的かつ持続可能なデザインで認められる影響力のあるファッションデザイナーステラ・マッカートニーが挙げられます。
再度、プロンプトの言葉の詳細な違いを比較してみましょう。ただし、生成された女性のすべてが白人のように見えるという事実は別の議論の対象であり、それについては別途注意が必要です。以下は、私の視点から見ての2つの「最も」良い画像です。それぞれのプロンプトから1つずつです。
注意:透明性のために、興味本位でその後ポーのプロンプトをさらに4回実行しましたが、生成された16の存在しない女性のうち、5人が非白人のように見えました。この情報についてはご自由にご利用くださいが、試みて結果を報告する価値があると思いました。
ミッドジャーニーが基本的なプロンプトを使用して生成した画像の「最も」良いもの
ミッドジャーニーがポーのプロンプトを使用して生成した画像の「最も」良いもの
再度、私はポーのアシストを受けたプロンプトの方がよりリアルな見た目だと考えます。それらはより「自然」な感じがあり、AIによる生成であることを判断するのに基本的なプロンプトの画像よりも少し時間がかかります。照明や屋外の要素はより自然に見えますし、大きな差ではありませんが、わずかに良いと言えるでしょう。
結論
おそらくこの記事は「ポーと一緒にキックアスなミッドジャーニープロンプト???」と呼ばれるべきかもしれません。ポーのボットが画像生成のために明確に優れたプロンプトを作成するのにどれだけ役立つかは、まだ議論の余地があると思いますが、それはわずかな一対の例では解決されません。私は基本的なプロンプトよりもポーのアシストが少し好きでしたが、これも主観的な意見であり、非常に少数のデータポイントを使用して行った判断です。おそらく、プロンプトエンジニアリングは複雑で気まぐれな存在であり、芸術(現実のものとAIによるものの両方)は何が何よりも優れているかを判断するには主観的すぎるのかもしれません。
Poeを試してみて、自分自身の画像生成プロジェクトにどのように機能するかを見てください。
Matthew Mayo(@mattmayo13)は、コンピューターサイエンスの修士号とデータマイニングの大学院ディプロマを持っています。VoAGIの編集長として、Matthewは複雑なデータサイエンスの概念をわかりやすくすることを目指しています。彼の専門的な興味は、自然言語処理、機械学習アルゴリズム、新興AIの探求を含みます。彼はデータサイエンスコミュニティでの知識の民主化を目指す使命に駆り立てられています。Matthewは6歳の時からコーディングを始めています。
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles