フェイブルスタジオは、TV番組の完全に新しいエピソードを書き、制作し、監督し、アニメーション化し、さらには声を担当できるAIプラットフォームであるSHOW-1をリリースしました

Fable Studio has released SHOW-1, an AI platform that can write, produce, direct, animate, and even provide voice for completely new episodes of TV programs.

自分が実生活で演技をしたことがなくても、お気に入りの番組で自分自身を見ることができることを想像できますか?また、始まりと終わりを好きなように変えることは可能ですか?

サンフランシスコのスタートアップ、Fable Studiosは、新しいエピソードを完全に書き、制作し、監督し、アニメーション化し、さらには声を出すことができるSHOW-1 AIテクノロジーをリリースしました。Fable Studiosは、異なる拡散モデルを使用してこれを実現しました。これらは時間の経過に伴ってデータからランダムなノイズを追加したり削除したりする単純な方法で、出力を生成し再構築することができます。ランダムなノイズとして画像を使用し、徐々に必要な出力に変換することができます。

Fable Studiosは、テレビ番組『サウスパーク』からの1200人のキャラクターと600枚の背景画像からなるデータセットを使用して、拡散モデルをトレーニングしました。最初のモデルのタスクは、背景色に対して単一のキャラクターを生成することでした。個々の特徴的な外見、執筆スタイル、声に基づいて、自律的なキャラクターを生成することができます。キャラクターの拡散モデルを使用すると、画像から画像への安定した拡散により、自分自身の外見に基づいてサウスパークのキャラクターを作成することができます。

2番目のモデルのタスクは、キャラクターが相互作用できるようなステージとなるクリーンな背景を生成することでした。ただし、このモデルの制限は、低解像度の画像を生成することでした。チームは、画像の品質を向上させるためにAIのアップスケーリング技術を使用してこれに対処しました。拡大縮小しても解像度が失われないベクトルベースのグラフィックスを生成します。

Fable Studiosは、特定の場所と実行時間のダイアログのシーケンスを変更してオリジナルのエピソードの長さに合わせてテレビ番組のエピソードを再定義しました。シミュレーションデータをプロンプトチェインとして使用することで、ショーランナーのシステムと並行して実行されるストーリーシステムを構築し、アクションとダイアログのシーケンスを監視して視聴者を引きつけます。各キャラクターの声は事前にクローンされ、新しいダイアログごとに音声クリップが生成されます。

シミュレーションによって生成されるデータは、最初のプロンプトを書く個人と生成されるストーリーシステムの両方にとって創造的な辞書となります。経験豊富なストーリーライターでもダイアログの執筆に行き詰まることがよくありますが、シミュレーションはプロンプトチェインを開始する前に文脈やデータポイントを提供するため、このような問題を克服することができます。

ストーリー生成プロセスは、ユーザー、シミュレーション、GPT-4の割合で共有されます。シミュレーションはキャラクターの過去のコンテキスト、感情、イベントなどの基礎的な文脈を生成します。これは最初の創造的な文脈となります。GPT 4は、ユーザーやシミュレーションからのプロンプトに基づいてシーンと対話を統合する主要な生成エンジンとして機能します。

最後に、シミュレーション、ユーザー、AIモデルの強みを統合することで、よりインタラクティブで魅力的なストーリーテリング体験が生まれます。逆に、番組の個別化は雇用の減少につながるでしょう。AIのパワーを持ったツールは、かつて人間の専門家が行っていたビデオ編集や音楽作成などの作業を行うことができるため、エンターテイメント業界の将来に関する懸念が生じます。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

データサイエンス

オフポリシーモンテカルロ制御を用いた強化学習レーストラックの演習問題の解決

『「強化学習入門 第2版」の「オフポリシーモンテカルロ制御」セクション(112ページ)では、著者が興味深い演習を残してくれ...

データサイエンス

「SwimXYZとの出会い:水泳モーションとビデオのための合成データセット、3.4Mフレームにグラウンドトゥルースの2Dおよび3Dジョイントの注釈が付いています」

人間の動作キャプチャは、スポーツ、医療、エンターテイメント業界のキャラクターアニメーションなど、さまざまな業界で重要...

機械学習

このAI論文では、大規模言語モデルでの関連しない行動について探求されています:“シミュレートされた株式取引におけるGPT-4の欺瞞的な戦略”

一部の高度なAIシステムが戦略的な欺瞞を行う可能性について懸念が出ています。AIシステムの安全性を評価することに特化したA...

人工知能

「ChatGPT Canvaプラグインでグラフィックデザイン活動を自動化する」

必要なデザインを開発するための時間を最小限に抑えてください

AI研究

新しい視点から世界を見るために反射を使用する

新しいコンピュータビジョンシステムは、光沢のあるオブジェクトをある種のカメラに変え、観察者が角や障害物の向こう側を見...

機械学習

Google DeepMind(グーグルディープマインド)が「GNoME(グノーム)」を発表:新素材の安定性を予測し、探索の速度と効率を劇的に向上させる新しいディープラーニングツール

無機結晶は、コンピュータチップ、バッテリー、太陽電池など、現代の多くの技術にとって不可欠です。安定した結晶は、細心の...