2Dアセット生成:ゲーム開発のためのAI #4
2Dアセット生成 AI #4
AIゲーム開発へようこそ!このシリーズでは、AIツールを使用してわずか5日で完全な機能を備えた農業ゲームを作成します。このシリーズの最後までに、ゲーム開発のワークフローにさまざまなAIツールを組み込む方法を学ぶことができます。以下の項目でAIツールを使用する方法を紹介します:
- アートスタイル
- ゲームデザイン
- 3Dアセット
- 2Dアセット
- ストーリー
クイックビデオ版が欲しいですか?こちらでご覧いただけます。それ以外の場合は、技術的な詳細を読み続けてください!
注意:このチュートリアルは、Unity開発とC#に精通している読者を対象としています。これらの技術に初めて触れる場合は、続ける前に「初心者向けUnityシリーズ」をご覧ください。
Day 4: 2Dアセット
このチュートリアルシリーズのパート3では、テキストから3Dへの変換はまだ準備ができていません。しかし、2Dに関しては状況は全く異なります。
- Intel Sapphire Rapidsを使用してPyTorch Transformersを高速化する – パート2
- ストーリーの生成:ゲーム開発のためのAI #5
- 音声合成、音声認識、そしてSpeechT5を使ったその他の機能
このパートでは、AIを使用して2Dアセットを生成する方法について話します。
はじめに
このチュートリアルでは、Stable Diffusionを従来の2Dワークフローのツールとして組み込んだ、2Dアセットの共同制作プロセスについて説明します。これは、画像編集と2Dアセット作成についてある程度知識のある読者を対象としていますが、初心者や専門家にも役立つかもしれません。
必要条件:
- お好みの画像編集ソフトウェア(PhotoshopやGIMPなど)
- Stable Diffusion。Stable Diffusionのセットアップ手順については、パート1を参照してください。
Image2Image
Stable Diffusionなどの拡散モデルは、ノイズから画像を再構築することで動作します。Image2Imageは同じプロセスを使用しますが、ノイズではなく実際の画像を入力として使用します。つまり、出力はある程度入力画像に似たものになります。
Image2Imageの重要なパラメータはノイズ除去の強さです。これはモデルが入力をどれだけ変更するかを制御します。ノイズ除去の強さが0の場合、入力画像を完全に再現します。一方、ノイズ除去の強さが1の場合、非常に異なる画像が生成されます。ノイズ除去の強さを考える別の方法はクリエイティビティです。以下の画像は、円の入力画像と「月」のプロンプトを使用したイメージツーイメージを、さまざまなノイズ除去の強さで示しています。
Image2Imageでは、Stable Diffusionを従来の芸術的ワークフローの代わりではなく、ツールとして使用することができます。つまり、自分で作成した手作りのアセットをImage2Imageに渡し、手作業で結果を反復することができます。農業ゲームの例を見てみましょう。
例:トウモロコシ
このセクションでは、農業ゲームのためにトウモロコシのアイコンを生成する方法について説明します。まず、画像の構成をレイアウトするために、非常にざっくりとしたトウモロコシのアイコンのスケッチを描きました。
次に、次のプロンプトを使用してImage2Imageを使用していくつかのアイコンを生成しました:
トウモロコシ、ジェームズ・ギレード、アテイ・ゲイラン、ピクサーのコンセプトアーティスト、スターデューバレー、あつまれどうぶつの森
モデルがよりクリエイティブになるように、ノイズ除去の強さを0.8に設定しました。何度か生成した後、気に入った結果を見つけました。
画像は完璧である必要はありません。進行方向に近いものであれば問題ありません。なぜなら、私たちは反復し続けるからです。私の場合、生成されたスタイルが気に入ったが、茎が少し複雑すぎると感じました。そのため、Photoshopでいくつかの修正を加えました。
気に入らない部分を大まかに塗りつぶし、Stable Diffusionに詳細を補完させることで、修正した画像をImage2Imageに戻しました。今回は、入力からあまり逸脱したくなかったため、ノイズ除去の強さを0.6に設定しました。これにより、ほぼ満足のいくアイコンが生成されました。
トウモロコシの茎のベースが私にとって少し絵画的すぎるし、頭から芽が出ているため、これらをPhotoshopで塗りつぶし、Stable Diffusionでさらに1回修正し、背景を取り除きました。
さあ、10分以内にゲーム用のトウモロコシアイコンの完成です。ただし、より良い結果を得るためには、より長い時間をかけることができます。より詳細なアセット作成の手順については、このビデオをおすすめします。
例:鎌
多くの場合、目的の結果を得るためには、安定拡散と少し戦う必要があります。私にとって、鎌のアイコンの場合、望んだ方向に進むために多くの反復が必要でした。
問題はおそらく、農具としての鎌よりも武器としての鎌の方がインターネット上にははるかに多くの画像が存在するという点にあります。これに対する一つの対策は、プロンプトエンジニアリング、つまりプロンプトを調整して望む方向に押し出すことです。たとえば、プロンプトに鎌、鎌の道具と書いたり、ネガティブプロンプトに武器と書いたりすることです。しかし、これだけが唯一の解決策ではありません。
Dreambooth、テキスト反転、LoRAは、拡散モデルをカスタマイズするための技術であり、より具体的な結果を得ることができます。これらはこのチュートリアルの範囲外ですが、2Dアセット生成の分野でますます重要になっていますので、言及する価値があります。
layer.aiやscenario.ggなどの生成サービスは、ゲームアセットの生成を特に対象としており、dreamboothやテキスト反転などの技術を使用して、ゲーム開発者がスタイルに一貫性のあるアセットを生成できるようにしています。ただし、新興の生成型ゲーム開発ツールキットでは、どの手法が台頭するかはまだ見えていません。
これらの高度なワークフローについてもっと深く探求したい場合は、このブログ投稿とDreamboothトレーニングのスペースをご覧ください。
ここをクリックして、第5部でAIをストーリーに活用する方法を読んでください。
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles