ETH ZurichとMax Plankの研究者が提案するHOOD グラフニューラルネットワーク、マルチレベルメッセージパッシング、および教師なし学習を活用して現実的な衣類のダイナミクスを効率的に予測する新しいメソッド
ETH ZurichとMax Plankの研究者が提案する新しいメソッドは、HOOD グラフニューラルネットワーク、マルチレベルメッセージパッシング、および教師なし学習を活用して、現実的な衣類のダイナミクスを効率的に予測します
テレプレゼンス、バーチャル試着、ビデオゲームなど、高品質のデジタルヒューマンに依存する多くのアプリケーションでは、魅力的かつリアルな衣料品の振る舞いをシミュレートする能力が必要です。物理法則に基づいたシミュレーションは、自然なダイナミックな動きを生み出すための人気のある手法です。物理シミュレーションは素晴らしい結果を提供するかもしれませんが、計算には高いコストがかかり、初期条件に敏感で、経験豊富なアニメーターが必要です。最先端の手法はリアルタイムアプリケーションに必要な厳しい計算予算を満たすために構築されていません。深層学習ベースの技術は、効率的かつ高品質な結果を生み出すことを始めています。
しかしながら、現在までにいくつかの制約がこれらの手法がその全てのポテンシャルを発揮することを阻んできました。まず、現在の技術は衣料品の変形を主に体の姿勢の関数として計算し、線形ブレンドスキニングに依存しています。スキニングベースのプランは、シャツやスポーツウェアのようなぴったりした服には印象的な結果を提供するかもしれませんが、ドレスやスカートなどのゆったりした衣料品には助けが必要です。重要なのは、多くの最先端の学習ベースの手法は衣料品固有であり、特定の衣装に対する変形しか予測できません。これらの手法を各衣料品に対して再学習する必要があるため、アプリケーションは制約されています。
本研究では、ETHチューリッヒとマックスプランク研究所の研究者が、グラフニューラルネットワーク(GNN)を用いた動的衣料品変形の予測に対する独自の手法を提供しています。彼らの手法は、局所的な変形、圧力、加速度の関係についての論理的な推論を通じて、物理的に現実的な布地の振る舞いを予測する方法です。彼らの手法は、衣料品の全体的な構造や形状に依存せず、任意の体の形状と運動に直接適用可能です。GNNは物理ベースのシミュレーションの代わりに有望な手法として示されていますが、衣料品のシミュレーションには満足のいく結果を生みません。各メッシュの頂点とその一つ周りの近傍の特徴ベクトルは、GNN(MLPとして実装)を使用して局所的に変換されます。
- 研究者たちは、磁気のトリックを使って、量子コンピューティングの進歩を遂げました
- MITの研究者が、生成プロセスの改善のために「リスタートサンプリング」を導入
- 2023年にフォローすべきトップ10のAIインフルエンサー
各変換のメッセージは、特徴ベクトルの更新に使用されます。この手順の反復により、信号はメッシュ全体に拡散します。ただし、メッセージパッシングのステージ数の制限により、信号の伝達はある半径に限られます。伸縮によって引き起こされる弾性波が素早く物質を通過する衣料品のモデリングでは、これにより頂点間の準全域的で瞬時の長距離結合が生じます。少なすぎるステップ数は、信号の伝達を遅くし、不快な過伸展のアーティファクトを引き起こし、衣料品に不自然なゴムのような外観を与えます。コンピュータの時間が増えるのは、愚かに反復回数を増やす代償です。
シミュレーションメッシュの最大サイズや解像度が事前にわからないため、保守的で適切に高い反復回数を選択することができず、この問題がさらに悪化します。彼らは、この問題を解決するために、階層的なネットワーク上で伝播フェーズを交互に行うメッセージパッシングシステムを提案しています。これにより、広範なサイズの剛性伸縮モードによって生じる高速波の効果的な処理が可能になり、同時に、折り目やしわなどの局所的な詳細を記述するために必要なキーを提供します。テストを通じて、彼らのグラフ表現が定性的および定量的なレベルで予測を向上させる方法を示しています。
暗黙の時間ステップの増分ポテンシャルとしての損失関数を採用することで、彼らはグラフベースのニューラルネットワークのアイデアと異なるシミュレーションを組み合わせ、自身の手法の汎化能力を向上させています。この形式化により、彼らはもはやどんなグラウンドトゥルース(GT)の注釈も必要としません。これにより、彼らのネットワークは完全に教師なしで訓練されることが可能になります。同時に、マルチスケールの衣料品ダイナミクス、材料パラメータの影響、衝突反応、および下にある体との摩擦的な接触を学習することができます。グラフ表現はまた、動いているシャツのボタンを外したり、形状が変化する衣料品をシミュレートすることも可能にします。
彼らのHOODアプローチでは、グラフニューラルネットワーク、マルチレベルのメッセージ伝達、および教師なしトレーニングを組み合わせて、さまざまな衣料品スタイルや体型に対するリアルな衣料品ダイナミクスのリアルタイム予測を可能にしています。彼らは実験的に、最先端の方法と比較して、彼らの手法が柔軟性と一般性の点で戦略的な利点を提供することを示しています。特に、単一のトレーニングされたネットワークが以下の点で優れていることを示しています:
- 幅広い衣料品に対して物理的にリアルなダイナミックモーションを効果的に予測します。
- トレーニング中に見たことのない新しい衣料品のタイプや形状にも一般化します。
- 材料特性や衣料品サイズのランタイムの変更を可能にします。
- ジッパーの開閉やシャツのボタンを外すなどの動的なトポロジー変化をサポートします。
モデルとコードはGitHubで研究目的で利用できます。
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- マイクロソフトの研究者がKOSMOS-2を紹介:視覚世界に根付くことができるマルチモーダルな大規模言語モデル
- コンピュータビジョンシステムは、画像認識と生成を結びつけたものです
- 希望、恐怖、そしてAI:AIツールに対する消費者の態度に関する最新の調査結果
- マイクロソフトリサーチは、競合モデルよりも大幅に小さいサイズで、Pythonコーディングに特化した新しい大規模言語モデルphi-1を紹介しました
- スタンフォード大学の研究者がSequenceMatchを紹介:模倣学習損失を用いたLLMsのトレーニング
- プリンストン大学の研究者が、自然界の写実的な3Dシーンの手続き生成器であるInfinigenを紹介しました
- Allen Institute for AI の研究者が、自然言語の指示に基づいて複雑で構成的な視覚的タスクを解決するための神経記号アプローチである VISPROG を紹介します