ETH ZurichとMax Plankの研究者が提案するHOOD グラフニューラルネットワーク、マルチレベルメッセージパッシング、および教師なし学習を活用して現実的な衣類のダイナミクスを効率的に予測する新しいメソッド

ETH ZurichとMax Plankの研究者が提案する新しいメソッドは、HOOD グラフニューラルネットワーク、マルチレベルメッセージパッシング、および教師なし学習を活用して、現実的な衣類のダイナミクスを効率的に予測します

テレプレゼンス、バーチャル試着、ビデオゲームなど、高品質のデジタルヒューマンに依存する多くのアプリケーションでは、魅力的かつリアルな衣料品の振る舞いをシミュレートする能力が必要です。物理法則に基づいたシミュレーションは、自然なダイナミックな動きを生み出すための人気のある手法です。物理シミュレーションは素晴らしい結果を提供するかもしれませんが、計算には高いコストがかかり、初期条件に敏感で、経験豊富なアニメーターが必要です。最先端の手法はリアルタイムアプリケーションに必要な厳しい計算予算を満たすために構築されていません。深層学習ベースの技術は、効率的かつ高品質な結果を生み出すことを始めています。

しかしながら、現在までにいくつかの制約がこれらの手法がその全てのポテンシャルを発揮することを阻んできました。まず、現在の技術は衣料品の変形を主に体の姿勢の関数として計算し、線形ブレンドスキニングに依存しています。スキニングベースのプランは、シャツやスポーツウェアのようなぴったりした服には印象的な結果を提供するかもしれませんが、ドレスやスカートなどのゆったりした衣料品には助けが必要です。重要なのは、多くの最先端の学習ベースの手法は衣料品固有であり、特定の衣装に対する変形しか予測できません。これらの手法を各衣料品に対して再学習する必要があるため、アプリケーションは制約されています。

本研究では、ETHチューリッヒとマックスプランク研究所の研究者が、グラフニューラルネットワーク(GNN)を用いた動的衣料品変形の予測に対する独自の手法を提供しています。彼らの手法は、局所的な変形、圧力、加速度の関係についての論理的な推論を通じて、物理的に現実的な布地の振る舞いを予測する方法です。彼らの手法は、衣料品の全体的な構造や形状に依存せず、任意の体の形状と運動に直接適用可能です。GNNは物理ベースのシミュレーションの代わりに有望な手法として示されていますが、衣料品のシミュレーションには満足のいく結果を生みません。各メッシュの頂点とその一つ周りの近傍の特徴ベクトルは、GNN(MLPとして実装)を使用して局所的に変換されます。

各変換のメッセージは、特徴ベクトルの更新に使用されます。この手順の反復により、信号はメッシュ全体に拡散します。ただし、メッセージパッシングのステージ数の制限により、信号の伝達はある半径に限られます。伸縮によって引き起こされる弾性波が素早く物質を通過する衣料品のモデリングでは、これにより頂点間の準全域的で瞬時の長距離結合が生じます。少なすぎるステップ数は、信号の伝達を遅くし、不快な過伸展のアーティファクトを引き起こし、衣料品に不自然なゴムのような外観を与えます。コンピュータの時間が増えるのは、愚かに反復回数を増やす代償です。

シミュレーションメッシュの最大サイズや解像度が事前にわからないため、保守的で適切に高い反復回数を選択することができず、この問題がさらに悪化します。彼らは、この問題を解決するために、階層的なネットワーク上で伝播フェーズを交互に行うメッセージパッシングシステムを提案しています。これにより、広範なサイズの剛性伸縮モードによって生じる高速波の効果的な処理が可能になり、同時に、折り目やしわなどの局所的な詳細を記述するために必要なキーを提供します。テストを通じて、彼らのグラフ表現が定性的および定量的なレベルで予測を向上させる方法を示しています。

暗黙の時間ステップの増分ポテンシャルとしての損失関数を採用することで、彼らはグラフベースのニューラルネットワークのアイデアと異なるシミュレーションを組み合わせ、自身の手法の汎化能力を向上させています。この形式化により、彼らはもはやどんなグラウンドトゥルース(GT)の注釈も必要としません。これにより、彼らのネットワークは完全に教師なしで訓練されることが可能になります。同時に、マルチスケールの衣料品ダイナミクス、材料パラメータの影響、衝突反応、および下にある体との摩擦的な接触を学習することができます。グラフ表現はまた、動いているシャツのボタンを外したり、形状が変化する衣料品をシミュレートすることも可能にします。

彼らのHOODアプローチでは、グラフニューラルネットワーク、マルチレベルのメッセージ伝達、および教師なしトレーニングを組み合わせて、さまざまな衣料品スタイルや体型に対するリアルな衣料品ダイナミクスのリアルタイム予測を可能にしています。彼らは実験的に、最先端の方法と比較して、彼らの手法が柔軟性と一般性の点で戦略的な利点を提供することを示しています。特に、単一のトレーニングされたネットワークが以下の点で優れていることを示しています:

  1. 幅広い衣料品に対して物理的にリアルなダイナミックモーションを効果的に予測します。
  2. トレーニング中に見たことのない新しい衣料品のタイプや形状にも一般化します。
  3. 材料特性や衣料品サイズのランタイムの変更を可能にします。
  4. ジッパーの開閉やシャツのボタンを外すなどの動的なトポロジー変化をサポートします。

モデルとコードはGitHubで研究目的で利用できます。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI研究

Google DeepMindとYouTubeの研究者は、Lyriaという高度なAI音楽生成モデルを発表しました

最近の発表では、GoogleのDeepMindがYouTubeとの協力のもと、芸術的表現の風景を変えるであろう音楽生成モデルLyriaを発表し...

データサイエンス

「バランスのとれたアクト:推薦システムにおける人気バイアスの解消」

ある朝、目が覚めて自分を労わすために新しい靴を買おうと決めましたお気に入りのスニーカーウェブサイトにアクセスして、あ...

AIニュース

「医師がAIとの患者ケアで葛藤し、緩い監視を指摘する」

F.D.A.は人工知能を使用する多くの新しいプログラムを承認しましたが、医師たちは、これらのツールが介護を本当に改善するか...

AIニュース

「RBIは、Conversational AIとオフライン決済の使用をUPIで採用する」

デジタル決済において新たな地平を切り開くため、インド準備銀行(RBI)は高度な統合支払いインターフェース(UPI)の機能を...

AI研究

ソルボンヌ大学の研究者は、画像、ビデオ、音声、言語のタスクに対する統合AIモデル「UnIVAL」を紹介しました

一般的なモデルを作成するための大きな進歩の一つは、大規模な言語モデル(LLM)の出現です。彼らの驚異的なテキスト理解およ...

機械学習

機械学習を用いたサッカータッチダウンの予測

日本語訳:「フットボール全米のファンを結びつける、アメリカの伝統的なスポーツです1試合平均1670万人の視聴者数と、スーパ...