ニューラル輝度場の不確実性をどのように測定できますか?BayesRaysを紹介します:NeRFの革命的な事後フレームワーク

ニューラル輝度場の不確実性の測定方法は?BayesRays:NeRFの革新的な事後フレームワーク

3Dモデルの作成は、2D画像よりも没入感とリアルな表現を提供します。これにより、視点を変えてシーンを探索し、対話することができ、空間のレイアウトや情報の奥行きをより良く理解することができます。

これらは仮想現実(VR)および拡張現実(AR)アプリケーションにとって基本です。これらは、デジタル情報を現実世界にオーバーレイする(AR)または完全に仮想環境を作成する(VR)ことができ、ゲーム、教育、トレーニング、さまざまな産業でユーザーエクスペリエンスを向上させます。

Neural Radiance Fields(NeRFs)は、3Dシーンの再構築とレンダリングのためのコンピュータビジョン技術です。NeRFはシーンを3Dボリュームとして扱い、ボリューム内の各点に対応する色(放射)と密度があります。ニューラルネットワークは、異なる視点から取られた2D画像に基づいて、各点の色と密度を予測することを学習します。

NeRFsには、視点合成や深度推定など、複数の応用がありますが、マルチビュー画像からの学習には不確実性があります。これらを定量化するための現行の方法は、ヒューリスティックまたは計算コストが高いものです。Google DeepMind、Adobe Research、およびトロント大学の研究者は、BayesRaysという新しい技術を紹介しました。

これは、トレーニングプロセスを変更せずに、事前学習された任意のNeRFの不確実性を評価するためのフレームワークです。空間的な摂動とベイジアン・ラプラス近似を使用して体積的な不確実性フィールドを追加することで、NeRFsの制約を克服することができました。ベイジアン・ラプラス近似は、複雑な確率分布をより単純な多変量ガウス分布で近似するための数学的な手法です。

彼らが計算した不確実性は統計的に有意であり、追加のカラーチャンネルとしてレンダリングすることができます。彼らの方法はまた、再構築された深度エラーとの相関などの主要な指標で以前の研究を上回っています。彼らは、アーキテクチャに関係なく、事前に学習されたNeRFの不確実性を定量化するためのプラグアンドプレイの確率的なアプローチを使用しています。彼らの研究は、リアルタイムで事前に学習されたNeRFからアーティファクトを除去するための閾値を提供します。

彼らは、3Dシーンのモデリングに体積フィールドを使用するという彼らの方法についての直感があると述べています。体積変形フィールドは、暗黙的に表現されたオブジェクトを操作するためによく使用されます。彼らの研究はまた、フォトグラメトリーに似ており、再構築の不確実性はしばしば空間位置にガウス分布を配置することによってモデル化されます。

最後に、彼らは彼らのアルゴリズムがNeRFの不確実性を定量化することに限定され、他のフレームワークに簡単に翻訳することはできないと述べています。ただし、彼らの将来の研究では、3Dガウススプラッティングなどの新しい空間表現に対しても形状変形ベースのラプラス近似を用いることが予定されています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

この人工知能ベースのタンパク質言語モデルは、汎用のシーケンスモデリングを解除します

人々が生命の言語を学ぶ方法は、自然言語の構文意味とタンパク質のシーケンス機能を比較することによって根本的に変わりまし...

機械学習

ドメイン固有アプリケーションのためのLLM細かい調整戦略

「LLMファインチューニングとは何か、LLMをドメイン特化アプリケーションに適応する方法、ファインチューニングの種類などを...

機械学習

「生成モデルを本番環境に展開する際の3つの課題」

OpenAI、Google、Microsoft、Midjourney、StabilityAI、CharacterAIなど、誰もがテキストからテキスト、テキストから画像、画...

AIニュース

スタビリティAIのスタブルディフュージョンXL 1.0:AI画像生成の画期的なブレークスルー

先進的なAIスタートアップであるStability AIは、Stable Diffusion XL 1.0のローンチにより、再び生成型AIモデルの限界に挑戦...

AI研究

中国からのニューエーアイ研究は、GLM-130Bを紹介しますこれは、13兆のパラメータを持つバイリンガル(英語と中国語)のプリトレーニング言語モデルです

最近、大規模言語モデル(LLM)のゼロショットおよびフューショットの能力は大幅に向上し、100Bパラメータ以上を持つモデルは...

データサイエンス

拡散モデルの利点と制約

拡散モデルは、非常にリアルな映像を通じて生成型AIを進化させますが、計算ニーズと倫理面に制約がありますその能力と課題を...