「カートゥーンアニメーションの未来を照らす:ラインドローイングインビトのイノベーション」

「カートゥーンアニメーションの未来を輝かせる:ラインドローイングインビトのイノベーション」

“`html

1900年代初頭にアニメーション制作が始まって以来、カートゥーンアニメーションは大きな進歩を遂げてきました。アニメーターが手描きでフレームを1枚ずつ描いていた時代から、カラーリゼーションや特殊効果などアニメーション制作の特定のタスクを支援するために自動化技術が導入されましたが、各フレームのキャラクターの線画を手描きするという基本的な作業は2Dアニメーションにおいては労働集約的なものです。

2つのキーフレームから中間線画を自動生成するためのアルゴリズムの開発、一般的に「インビート」と呼ばれるプロセスは、業界内で生産性を大幅に向上させる潜在的な能力を持っています。線画のインビートは、一般的なフレーム補完と比較して、線画の希薄さにより独特のチャレンジがあります。これらの線画は通常、約3%の黒いピクセルを含み、残りのイメージは白い背景になっています。この特異性は、既存のラスタイメージベースのフレーム補完手法に対して2つの重要な課題を提起します。まず、線画のテクスチャの欠如により、フレーム補完においてピクセルごとの対応を正確に計算することが困難になり、単一のピクセルに対する複数の類似の一致候補による不正確な動きの予測が生じます。次に、フレーム補完で使用されるワーピングとブレンディング技術は、線と背景の重要な境界をぼかすことがあり、詳細の大幅な損失を引き起こします。

上記の問題を考慮して、「AnimeInbet」と呼ばれる新しい深層学習フレームワークが提案されました。このフレームワークは、ラスタイメージではなくジオメトリ化された形式で線画のインビートを実行します。アプローチの概要は以下の図に示されています。

このプロセスでは、ソースイメージをベクトルグラフに変換して中間グラフを合成します。この改変は、先に述べた課題に対処します。ジオメトリ領域のマッチングプロセスは、すべてのピクセルではなく密集したジオメトリエンドポイント頂点に焦点を当てることで、潜在的な曖昧さを減らし、対応の正確性を高めます。さらに、配置プロセスでは、線画のトポロジーを保持するため、複雑で緻密な線構造の保持が可能です。

AnimeInbetフレームワークの基本的なコンセプトは、2つの入力線画グラフ間のマッチング頂点の特定を行い、それらを再配置して新しい中間グラフを作成することです。プロセスは、頂点のエンコーディング戦略の開発から始まります。これにより、まばらに描かれた線のエンドポイントのジオメトリ的特徴を区別することができます。その後、頂点対応トランスフォーマーを使用して、2つの入力線画のエンドポイント間でのマッチングを確立します。マッチした頂点からのシフトベクトルは、集約された特徴の類似性に基づいて一致しない頂点に伝播され、すべてのエンドポイントの再配置を容易にします。最後に、フレームのインビート中に覆われる頂点とエッジを除去するための可視性マスクを予測し、クリーンで完全な中間フレームの作成を確保します。

頂点対応の教師付きトレーニングをサポートするために、MixamoLine240という新しいデータセットが導入されました。このユニークなデータセットは、グラウンドトゥルースのジオメトリ化および頂点のマッチングラベルを持つ線画を提供しています。データセットの2D線画は、3Dモデルの特定のエッジから選択的に生成され、エンドポイントはインデックス付きの3D頂点に対応します。3D頂点を参照点として使用することで、データセットの頂点レベルでの頂点対応ラベルの正確性と一貫性を確保しています。

既存の手法と比較して、AnimeInbetフレームワークは、クリーンで完全な中間線画を生成する能力を実証しています。研究からのいくつかの例を以下に報告します。

“`

これは、アニメインベットの要約であり、ラスター画像ではなく幾何化された形式で線画のインビトゥイングを行う新しいAI技術です。興味があり、詳細を学びたい場合は、以下のリンクを参照してください。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AIテクノロジー

ピカ1.0:ビデオ作成のための新しいAIモデル

世界中で生成AIに魅了されているPikaは、AIを活用した動画作成に特化したスタートアップで、Lightspeed Venture Partnersが主...

機械学習

「生成モデルを本番環境に展開する際の3つの課題」

OpenAI、Google、Microsoft、Midjourney、StabilityAI、CharacterAIなど、誰もがテキストからテキスト、テキストから画像、画...

人工知能

簡単なアプリの統合に最適な安定した拡散APIのトップ5

イントロダクション APIは人工知能の時代における解決策であり、AIモデルをソフトウェアやアプリケーションに統合する際の高...

AIニュース

ウィンブルドンがAIによる実況を導入

テニス愛好家にとって素晴らしいニュースです!世界で最も権威のあるテニストーナメントの一つであるウィンブルドンは、最新...

機械学習

AIの聴覚スキルを革命化する:清華大学とバイトダンスが、高度なオーディオ処理のための画期的なマルチモーダルニューラルネットワーク「SALMONN」を発表

さまざまな自然言語処理アプリケーションでは、テキストベースの大規模言語モデルが印象的であり、人間に近いパフォーマンス...

機械学習

AIがYouTubeの多言語吹替を開始します

世界最大の動画共有プラットフォームであるYouTubeは、AI技術の統合により、コンテンツクリエイターが世界中の観客と接触する...