「CT2Hairに会ってください:ダウンストリームグラフィックスアプリケーションで使用するために適した高精細な3Dヘアモデルを完全自動で作成するフレームワーク」

CT2Hair a framework for creating high-resolution 3D hair models automatically, suitable for use in downstream graphics applications.

ゲームが好きな人は誰ですか?ゲームの中のキャラクターが自然でファッション感のあるほど、私たちはそれをより楽しめます。自然な髪の毛のように見えるグラフィックスは可能でしょうか?

3Dの髪の毛作成ツールに加え、アーティストによる手作りは時間がかかり、スケールするのも難しく、現在の3Dの作成ツールの制約によってバイアスがかかる可能性もあります。カール、シルキー、ストレート、ウェーブなど、幅広い現実世界の髪の毛のバリエーションを正確に表現した大規模なデータセットを作成することは大きな課題です。国家重点实验室とMeta Reality Labsの研究者は、実際の髪の毛ウィッグを入力としてさまざまなヘアスタイルのグラフィックスを再構築することに成功しました。

研究者たちは、髪の毛の領域の密度ボリュームを作成し、可視表面の画像ベースのアプローチとは異なり、髪の毛の内部を見ることができるようにしました。密度ボリュームを作成するために用いられた手法は、計算トモグラフィー(CT)でした。高い解像度と大きなスキャンボリュームのためにCTを使用し、X線を使用してCTを行いました。CT X線は通常、人間の組織や一般的なオブジェクトの再構築に使用されます。髪の毛の糸の薄い構造のため、CTから完全な人間の髪の毛の糸を回復することは容易ではありません。これにより、CTイメージングにノイズが生じ、解像度が低下します。この問題に対処するために、彼らは粗いから細かいアプローチを取りました。

彼らはまず、ノイズのある密度ボリューム(実際の髪の毛ウィッグ)から3Dの方向フィールドを推定し、推定された方向フィールドを使用して有用なガイドストランドを抽出しました。次に、ニューラル補間法を使用して頭皮にストランドを配置し、最後に最適化を行って、入力の密度ボリュームに正確に準拠するように洗練させました。最適化ステップでは、再構築された髪の毛のストランドを入力ボリュームによりよく整列させることが含まれます。彼らの作業には特定の髪の種類のための手作りの事前情報は含まれていないため、彼らは単一のフレームワークで多様なヘアスタイルを復元することができます。

研究者たちは、他の3つの画像ベースの手法(単一視点ベース、希薄視点ベース、密視点ベース)と自身の手法を比較しました。彼らは、単一視点ベースと希薄視点ベースの手法は比較的シンプルなヘアスタイルには適切な結果を生み出しましたが、カールヘアではトレーニングデータセットの不足のために大きな失敗をしました。密視点ベースの手法はこれらの2つの手法を上回りましたが、内部のジオメトリを推測することに失敗し、結果として不完全なジオメトリを生成しました。対照的に、研究者たちのモデルは良いジオメトリを示し、より多くの詳細を含んでいるため、リアルに見えます。

しかし、このアイデオロギーを実際の人間の頭部のキャプチャに拡張することは依然として挑戦です。産業用CTスキャナーは、生物に対する安全基準を超える大量のX線を使用するため、これを使用して顔のジオメトリをモデリングすることは不可能です。研究者たちは、キャプチャ中のわずかな動きでも密度ボリュームに大きなぼやけが生じると述べています。

機械学習アプローチを実装することにより、将来の研究では、医療用CTスキャナーを使用して、低解像度の密度ボリュームからでも高品質な3D髪データの大規模なコーパスを生成し、3D髪モデルを推測することが可能になるかもしれません。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI研究

新しい研究論文が、化学の論文がChatbot ChatGPTを使用して書かれた時に簡単に見分けることができる機械学習ツールを紹介しています

AIの進歩が支配的な時代において、特に科学論文における人間とAIによるコンテンツの区別はますます重要になっています。この...

データサイエンス

『GPT-4を使用したパーソナライズされたAIトレーディングコンサルタントの構築』

はじめに 近年、人工知能(AI)を株式取引に統合することで、投資家の意思決定に革命が起きています。GPT-3やGPT-4などの大規...

機械学習

「プリズマーに会いましょう:専門家のアンサンブルを持つオープンソースのビジョン-言語モデル」

最近の多くのビジョン言語モデルは、非常に注目すべき多様な生成能力を示しています。しかし、通常、それらは膨大なモデルと...

機械学習

BYOL(Bootstrap Your Own Latent)— コントラスティブな自己教示学習の代替手段

『今日の論文分析では、BYOL(Bootstrap Your Own Latent)の背後にある論文に詳しく触れますこれは、対比的な自己教師あり学...

人工知能

オープンソースとオープンイノベーションによるAIシーンの破壊

AIの運命は、オープンソースとオープンイノベーションを活用する小規模なVoAGI企業によって追い越されることですGoogleやOpen...

AIニュース

「OpenAI、マイクロソフトの支援を受けてGPT-5開発に向けて準備を進める」

次世代AI分野を指し示す大胆な動きとして、OpenAIのCEOサム・オルトマンは人気の高いChatGPTの後継機であるGPT-5の開発を示唆...