「カートゥーンアニメーションの未来を照らす:ラインドローイングインビトのイノベーション」
「カートゥーンアニメーションの未来を輝かせる:ラインドローイングインビトのイノベーション」
“`html
1900年代初頭にアニメーション制作が始まって以来、カートゥーンアニメーションは大きな進歩を遂げてきました。アニメーターが手描きでフレームを1枚ずつ描いていた時代から、カラーリゼーションや特殊効果などアニメーション制作の特定のタスクを支援するために自動化技術が導入されましたが、各フレームのキャラクターの線画を手描きするという基本的な作業は2Dアニメーションにおいては労働集約的なものです。
2つのキーフレームから中間線画を自動生成するためのアルゴリズムの開発、一般的に「インビート」と呼ばれるプロセスは、業界内で生産性を大幅に向上させる潜在的な能力を持っています。線画のインビートは、一般的なフレーム補完と比較して、線画の希薄さにより独特のチャレンジがあります。これらの線画は通常、約3%の黒いピクセルを含み、残りのイメージは白い背景になっています。この特異性は、既存のラスタイメージベースのフレーム補完手法に対して2つの重要な課題を提起します。まず、線画のテクスチャの欠如により、フレーム補完においてピクセルごとの対応を正確に計算することが困難になり、単一のピクセルに対する複数の類似の一致候補による不正確な動きの予測が生じます。次に、フレーム補完で使用されるワーピングとブレンディング技術は、線と背景の重要な境界をぼかすことがあり、詳細の大幅な損失を引き起こします。
上記の問題を考慮して、「AnimeInbet」と呼ばれる新しい深層学習フレームワークが提案されました。このフレームワークは、ラスタイメージではなくジオメトリ化された形式で線画のインビートを実行します。アプローチの概要は以下の図に示されています。
- 「NExT-GPT あらゆるモダリティに対応したマルチモーダル大規模言語モデル」の紹介
- 「ChatGPTのような大規模言語モデルによる自己説明は感情分析にどれほど効果的か?パフォーマンス、コスト、解釈可能性に迫る深い探求」
- ニューラルネットワークにおける系統的組み合わせ可能性の解除:組み合わせ可能性のためのメタラーニング(MLC)アプローチによるブレイクスルー
このプロセスでは、ソースイメージをベクトルグラフに変換して中間グラフを合成します。この改変は、先に述べた課題に対処します。ジオメトリ領域のマッチングプロセスは、すべてのピクセルではなく密集したジオメトリエンドポイント頂点に焦点を当てることで、潜在的な曖昧さを減らし、対応の正確性を高めます。さらに、配置プロセスでは、線画のトポロジーを保持するため、複雑で緻密な線構造の保持が可能です。
AnimeInbetフレームワークの基本的なコンセプトは、2つの入力線画グラフ間のマッチング頂点の特定を行い、それらを再配置して新しい中間グラフを作成することです。プロセスは、頂点のエンコーディング戦略の開発から始まります。これにより、まばらに描かれた線のエンドポイントのジオメトリ的特徴を区別することができます。その後、頂点対応トランスフォーマーを使用して、2つの入力線画のエンドポイント間でのマッチングを確立します。マッチした頂点からのシフトベクトルは、集約された特徴の類似性に基づいて一致しない頂点に伝播され、すべてのエンドポイントの再配置を容易にします。最後に、フレームのインビート中に覆われる頂点とエッジを除去するための可視性マスクを予測し、クリーンで完全な中間フレームの作成を確保します。
頂点対応の教師付きトレーニングをサポートするために、MixamoLine240という新しいデータセットが導入されました。このユニークなデータセットは、グラウンドトゥルースのジオメトリ化および頂点のマッチングラベルを持つ線画を提供しています。データセットの2D線画は、3Dモデルの特定のエッジから選択的に生成され、エンドポイントはインデックス付きの3D頂点に対応します。3D頂点を参照点として使用することで、データセットの頂点レベルでの頂点対応ラベルの正確性と一貫性を確保しています。
既存の手法と比較して、AnimeInbetフレームワークは、クリーンで完全な中間線画を生成する能力を実証しています。研究からのいくつかの例を以下に報告します。
“`
これは、アニメインベットの要約であり、ラスター画像ではなく幾何化された形式で線画のインビトゥイングを行う新しいAI技術です。興味があり、詳細を学びたい場合は、以下のリンクを参照してください。
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- 「ULTRAに会おう:あらゆるグラフで機能する事前学習済みの知識グラフ推論用基礎モデルで、50以上のグラフで教師あり最先端モデルを上回るパフォーマンスを発揮します」
- 「Amazon Bedrockへのプライベートアクセスを設定するために、AWS PrivateLinkを使用してください」
- 「Amazon SageMaker JumpStartを使用して、2行のコードでファウンデーションモデルを展開して微調整する」
- Pythonでの機械学習のためのテキストの前処理−自然言語処理
- 「Xenovaのテキスト読み上げクライアントツール:自然な音声合成を実現する頑強で柔軟なAIプラットフォーム」
- 「機械学習手法を用いたJava静的解析ツールレポートのトリアージに関する研究」
- 「Inside LlaVA GPT-4Vのオープンソースの最初の代替案」