「ミケランジェロのAIいとこ:ニューランジェロは高精度な3D表面再構築が可能なAIモデルです[コードも含まれています]」

Michelangelo's AI cousin Newrangelo is an AI model capable of highly accurate 3D surface reconstruction [includes code].

ニューラルネットワークは近年かなり進化しており、ほとんどのアプリケーションで使用されています。最も興味深いユースケースの1つは、現実世界の3Dモデリングです。私たちは、通常のカメラを使用してシーンの3Dジオメトリを正確にキャプチャできるニューラル輝度場(NeRF)を見てきました。これらの進歩により、3D表面再構成の新たなページが開かれました。

3D表面再構成の目標は、複数の視点からキャプチャされた複数の画像を分析して、シーンの詳細なジオメトリ構造を回復することです。これらの再構成された表面には、拡張/仮想/複合現実のための3Dアセットの生成や、自律型ロボットのナビゲーションのための環境マッピングなど、さまざまなアプリケーションに適用できる貴重な構造情報が含まれています。特に興味深いアプローチは、単一のRGBカメラを使用した写真測量的な表面再構成です。これにより、一般的なモバイルデバイスを使用して、ユーザーは簡単に現実のデジタルレプリカを作成することができます。

3D表面再構成は、複数の画像から密なジオメトリ構造を生成することで、拡張/仮想/複合現実やロボット工学など、さまざまなアプリケーションに広範な活用が可能です。多視点ステレオアルゴリズムなどの古典的な手法は、疑わしい観測結果に対して苦労し、不正確または不完全な結果を生み出すことがよくあります。ニューラル表面再構成手法は、シーンを暗黙的な関数として表現するために座標ベースの多層パーセプトロン(MLP)を活用することで、有望な解決策として登場しました。ただし、現在の手法の忠実度は、MLPの容量とスケーリングがうまくいきません。

スケーリング問題を解決する方法があったらどうでしょうか?RGB入力だけで本当に正確な3D表面モデルを生成できたらどうでしょうか?それでは、ニューラルアンジェロに会いましょう。

ニューラルアンジェロはRGB画像から3D表面を再構築できます。 ソース:https://research.nvidia.com/labs/dir/neuralangelo/paper.pdf

ニューラルアンジェロは、インスタントNGP(ニューラルグラフィックスプリミティブ)のパワーとニューラルSDF表現を組み合わせて高品質の表面再構築を実現するフレームワークです。

ニューラルアンジェロは、ニューラル符号化された符号距離関数(SDF)表現としてインスタントNGPを採用しています。インスタントNGPは、多分解ハッシュエンコーディングを備えたハイブリッド3Dグリッド構造と、ログリニアメモリフットプリントを維持しながら表現力を向上させる軽量MLPを導入しています。このハイブリッド表現は、ニューラルフィールドの表現力を大幅に向上させ、細部までの情報をキャプチャする能力に優れています。

ハッシュ符号化された表面再構築の品質をさらに向上させるために、ニューラルアンジェロは2つのキーコンセプトを導入しています。まず、表面法線などの高次導関数を計算するために数値勾配が使用され、最適化プロセスの安定化に貢献します。次に、進行的な最適化スケジュールが実装され、異なる詳細レベルでの構造の回復が可能になり、包括的な再構築アプローチが実現されます。これらのテクニックは相互に作用し、再構築の精度とビューシンセシスの品質の両方において大幅な改善をもたらします。

Neuralangeloの概要。 ソース:https://research.nvidia.com/labs/dir/neuralangelo/poster.pdf

ニューラルアンジェロは、マルチ解像度ハッシュ符号化のパワーをニューラルSDF表現に自然に組み込んでおり、再構築能力が向上しています。さらに、数値勾配とアイコナール正則化の使用により、ハッシュ符号化された表面再構築の品質が向上し、最適化プロセスが安定化します。最後に、標準ベンチマークと実世界のシーンでの幅広い実験により、ニューラルアンジェロの効果が実証され、再構築の精度とビューシンセシスの品質の両方において、従来の画像ベースのニューラル表面再構築手法に比べて大幅な改善が示されています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

「PDF、txt、そしてウェブページとして、あなたのドキュメントと話しましょう」

LLMsを使用してPDF、TXT、さらにはウェブページなどのドキュメントに質問をすることができるウェブと知能を作成するための完...

機械学習

Google DeepMindは、ChatGPTを超えるアルゴリズムの開発に取り組んでいます

画期的な発表により、GoogleのDeepMind AI研究所のCEOであるデミス・ハサビス氏は、革新的なAIシステムであるGeminiの開発を...

AIニュース

「AutoGenを使った戦略的AIチームビルディングが簡単になりました」

イントロダクション デジタルフロンティアが無限の領域に達し、AutoGenは変革的なパラダイムの設計者として現れます。異なる...

機械学習

NVIDIA CEO:クリエイターは生成的AIによって「スーパーチャージ」されるでしょう

ジェンスン・ファウンダー兼CEOは、フランスのリビエラ地方で開催されたカンヌライオンズフェスティバルで、ジェンスン・ファ...

人工知能

「Retrato:セルフィーをプロの写真に変える」

予算の関係でプロの写真撮影が難しい場合、非常に安価なオプションがありますそれが「Retrato」です

データサイエンス

「PaLM 2はどのように動作しますか?完全ガイド」

「PaLM 2の機能を完全に解説するガイドで、内部の仕組みを探求しましょうこの強力な言語モデルがどのように人間らしいテキス...