ETH ZurichとMax Plankの研究者が提案するHOOD グラフニューラルネットワーク、マルチレベルメッセージパッシング、および教師なし学習を活用して現実的な衣類のダイナミクスを効率的に予測する新しいメソッド

ETH ZurichとMax Plankの研究者が提案する新しいメソッドは、HOOD グラフニューラルネットワーク、マルチレベルメッセージパッシング、および教師なし学習を活用して、現実的な衣類のダイナミクスを効率的に予測します

テレプレゼンス、バーチャル試着、ビデオゲームなど、高品質のデジタルヒューマンに依存する多くのアプリケーションでは、魅力的かつリアルな衣料品の振る舞いをシミュレートする能力が必要です。物理法則に基づいたシミュレーションは、自然なダイナミックな動きを生み出すための人気のある手法です。物理シミュレーションは素晴らしい結果を提供するかもしれませんが、計算には高いコストがかかり、初期条件に敏感で、経験豊富なアニメーターが必要です。最先端の手法はリアルタイムアプリケーションに必要な厳しい計算予算を満たすために構築されていません。深層学習ベースの技術は、効率的かつ高品質な結果を生み出すことを始めています。

しかしながら、現在までにいくつかの制約がこれらの手法がその全てのポテンシャルを発揮することを阻んできました。まず、現在の技術は衣料品の変形を主に体の姿勢の関数として計算し、線形ブレンドスキニングに依存しています。スキニングベースのプランは、シャツやスポーツウェアのようなぴったりした服には印象的な結果を提供するかもしれませんが、ドレスやスカートなどのゆったりした衣料品には助けが必要です。重要なのは、多くの最先端の学習ベースの手法は衣料品固有であり、特定の衣装に対する変形しか予測できません。これらの手法を各衣料品に対して再学習する必要があるため、アプリケーションは制約されています。

本研究では、ETHチューリッヒとマックスプランク研究所の研究者が、グラフニューラルネットワーク(GNN)を用いた動的衣料品変形の予測に対する独自の手法を提供しています。彼らの手法は、局所的な変形、圧力、加速度の関係についての論理的な推論を通じて、物理的に現実的な布地の振る舞いを予測する方法です。彼らの手法は、衣料品の全体的な構造や形状に依存せず、任意の体の形状と運動に直接適用可能です。GNNは物理ベースのシミュレーションの代わりに有望な手法として示されていますが、衣料品のシミュレーションには満足のいく結果を生みません。各メッシュの頂点とその一つ周りの近傍の特徴ベクトルは、GNN(MLPとして実装)を使用して局所的に変換されます。

各変換のメッセージは、特徴ベクトルの更新に使用されます。この手順の反復により、信号はメッシュ全体に拡散します。ただし、メッセージパッシングのステージ数の制限により、信号の伝達はある半径に限られます。伸縮によって引き起こされる弾性波が素早く物質を通過する衣料品のモデリングでは、これにより頂点間の準全域的で瞬時の長距離結合が生じます。少なすぎるステップ数は、信号の伝達を遅くし、不快な過伸展のアーティファクトを引き起こし、衣料品に不自然なゴムのような外観を与えます。コンピュータの時間が増えるのは、愚かに反復回数を増やす代償です。

シミュレーションメッシュの最大サイズや解像度が事前にわからないため、保守的で適切に高い反復回数を選択することができず、この問題がさらに悪化します。彼らは、この問題を解決するために、階層的なネットワーク上で伝播フェーズを交互に行うメッセージパッシングシステムを提案しています。これにより、広範なサイズの剛性伸縮モードによって生じる高速波の効果的な処理が可能になり、同時に、折り目やしわなどの局所的な詳細を記述するために必要なキーを提供します。テストを通じて、彼らのグラフ表現が定性的および定量的なレベルで予測を向上させる方法を示しています。

暗黙の時間ステップの増分ポテンシャルとしての損失関数を採用することで、彼らはグラフベースのニューラルネットワークのアイデアと異なるシミュレーションを組み合わせ、自身の手法の汎化能力を向上させています。この形式化により、彼らはもはやどんなグラウンドトゥルース(GT)の注釈も必要としません。これにより、彼らのネットワークは完全に教師なしで訓練されることが可能になります。同時に、マルチスケールの衣料品ダイナミクス、材料パラメータの影響、衝突反応、および下にある体との摩擦的な接触を学習することができます。グラフ表現はまた、動いているシャツのボタンを外したり、形状が変化する衣料品をシミュレートすることも可能にします。

彼らのHOODアプローチでは、グラフニューラルネットワーク、マルチレベルのメッセージ伝達、および教師なしトレーニングを組み合わせて、さまざまな衣料品スタイルや体型に対するリアルな衣料品ダイナミクスのリアルタイム予測を可能にしています。彼らは実験的に、最先端の方法と比較して、彼らの手法が柔軟性と一般性の点で戦略的な利点を提供することを示しています。特に、単一のトレーニングされたネットワークが以下の点で優れていることを示しています:

  1. 幅広い衣料品に対して物理的にリアルなダイナミックモーションを効果的に予測します。
  2. トレーニング中に見たことのない新しい衣料品のタイプや形状にも一般化します。
  3. 材料特性や衣料品サイズのランタイムの変更を可能にします。
  4. ジッパーの開閉やシャツのボタンを外すなどの動的なトポロジー変化をサポートします。

モデルとコードはGitHubで研究目的で利用できます。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

TinyLlamaと出会ってください:3兆トークンで1.1Bのラマモデルを事前学習することを目指した小さなAIモデル

言語モデルの研究の絶え間ない進化の中で、効率性と拡張性を追求する試みが、画期的なプロジェクトであるTinyLlamaによって導...

機械学習

「プログラマーの生産性を10倍にするための5つの無料のAIツール」

「これらの5つのAIツールは、プログラマーやコーダーの生活を簡単にするために、コーディングプロジェクトの速度と精度を向上...

AI研究

この脳AIの研究では、安定した拡散を用いて脳波から画像を再現します

人間の視覚システムと似たように、世界を見て認識する人工システムを構築することは、コンピュータビジョンの重要な目標です...

AIニュース

良いニュース!中国とアメリカがAIの危険性について話し合っています

世界の2つの超大国の科学者たちは、AIのリスクについて懸念しており、これはグローバルな規制を開発するための橋渡しを提供す...

機械学習

「Vchitectを紹介します:テキストからビデオ(T2V)およびイメージからビデオ(I2V)アプリケーションに適したオープンソースの大規模一般istビデオ作成システム」

“`html 人工知能(AI)の人気が爆発的に高まったことにより、深層生成モデルの大幅な進展が生まれました。これらのモデ...

データサイエンス

PyCharm vs. Spyder 正しいPython IDEの選択

PyCharmとSpyderはPython開発のための2つの最も人気のあるIDEですでは、PyCharmとSpyderの直接比較を見てみましょう