メタリサーチャーズがVR-NeRFを紹介:高精細なキャプチャーと仮想現実の歩行可能な空間のレンダリングのための先進的なエンドツーエンドAIシステム

メタリサーチャーズがVR-NeRFをご紹介:高精細なキャプチャーと仮想現実の歩行可能な空間のレンダリングを可能にする最先端のエンドツーエンドAIシステム

手頃な価格の仮想現実(VR)技術の登場により、現実的なVR写真やビデオなどの高度に没入型の映像メディアが大幅に成長しています。既存の手法は一般的に次の2つのカテゴリに分類されます:

  • 直径が1メートル未満の小さなヘッドボックスでの高品質のビュー合成は、ユーザーの動きを制限してしまいます。
  • 低品質またはフレームレートのシーンスケールの自由視点ビューシンセシスでは、ユーザーは自由に移動できますが、レンダリングされた画像の品質が低下します。

既存の手法の制限に対処するため、本論文の著者たちはVR-NeRFを導入しました。これは、ユーザーが実世界の空間を歩き回り、探索できる現実的なVR体験を作成することができるシステムです。研究者たちが使用したデータセットは、数千の5000万画素のHDR画像から成り、データセットのいくつかは100ギガピクセルを超えているため、彼らのシステムは高品質なビュー合成を実現できます。

最近、新鮮味のある視点合成を生成する能力から、神経輻射場(NeRF)の人気が大幅に増しています。ただし、既存のNeRF手法は大きくて複雑なシーンには適用できません。

研究者によって提案されたNeRF手法は、彼らが設計した高品質なデータセットに特化しており、高品質なリアルタイムVRレンダリングをサポートすることができます。研究者が使用したマルチカメラリグは、シーンの多数の均一に分布したHDR写真をキャプチャする特別なデバイスです。

VR-NeRFはまた、カスタムGPUレンダラも持っており、高品質なVRへのレンダリングを可能にします。また、レンダラは一定のフレームレートで36 Hzで実行されるため、魅力的なVR体験を提供します。研究者たちは、いくつかの改善を加えた瞬時ニューラルグラフィックスプリミティブ(NGP)を拡張し、正確な色で画像を生成し、品質と速度のトレードオフを最適化できるようにしています。

研究者たちはまた、彼らが挑戦的な高品質データセットでの結果の品質をデモンストレーションし、彼らの手法とデータセットを既存のベースラインと比較しました。彼らは、彼らの手法が歩行可能な空間の広いダイナミックレンジで高品質なVRレンダリングを生成できることを示しました。

結論として、VR-NeRFはVRでの歩行可能な空間のキャプチャ、再構築、およびレンダリングに対する包括的なアプローチです。この手法は、より高い解像度、フレームレート、および視覚的忠実度を実現し、包括的なVR体験を可能にします。研究者たちが提案した手法は、既存のVRアプリケーションの問題を解決し、ユーザーにより大きくて複雑なシーンを詳細に体験させる可能性があります。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

データサイエンス

このAI研究は、車両の後続振る舞いモデリングのための包括的なベンチマークデータセット「FollowNet」を紹介します

他の車に続くことは、最も一般的で基本的な運転行動です。他の車に安全に従うことは、衝突を減らし、交通の流れを予測しやす...

AI研究

このAI研究は、CoDi-2を紹介します:インターリーブされた指示処理とマルチモーダルな出力生成の風景を変える画期的なマルチモーダル大規模言語モデルです

研究者たちは、UCバークレー、Microsoft Azure AI、Zoom、UNC-Chapel Hillによって開発されたCoDi-2 Multimodal Large Langua...

機械学習

「プリズマーに会いましょう:専門家のアンサンブルを持つオープンソースのビジョン-言語モデル」

最近の多くのビジョン言語モデルは、非常に注目すべき多様な生成能力を示しています。しかし、通常、それらは膨大なモデルと...

AIニュース

「長い尾が犬に振り回される:AIの個別化されたアートに伴う予測不可能な影響」

メタの最近の生成型映画の世界でのエミューの発表は、技術と文化が前例のない形で交差する転換点を示しています。エミューは...

データサイエンス

OpenAIは、GPTBotを導入しましたこれは、インターネット全体からデータを自動的にスクレイピングするために設計されたウェブクローラです

OpenAIは、公開ウェブサイトでのデータ収集に起因するプライバシーや知的財産権の懸念に対応するため、GPTBotと呼ばれる新し...

機械学習

AWSにおけるマルチモデルエンドポイントのためのCI/CD

生産用機械学習ソリューションの再トレーニングと展開を自動化することは、モデルが共変量シフトを考慮しながら、誤りや不要...