中国の新しいAI研究は、ハードウェアラスタライゼーションをサポートし、前例のないレンダリング速度を実現する4Dポイントクラウド表現である4K4Dを提案しています

中国の新たなAI研究:4K4Dはハードウェアラスタライゼーションをサポートし、前例のない速度でレンダリングする4Dポイントクラウド表現の提案

Dynamic view synthesisは、キャプチャされたビデオから動的な3Dシーンを再構築し、没入型の仮想再生を作成するプロセスです。このプロセスは、コンピュータビジョンとグラフィックスの分野で長年の研究問題であり、VR / AR、スポーツ放送、芸術的パフォーマンスキャプチャの分野で大きな約束を持っています。

動的な3Dシーンの表現には、テクスチャつきメッシュシーケンスを使用した従来の方法がありますが、これらの方法は複雑で計算コストが高く、リアルタイムアプリケーションでは実用的ではありません。

最近では、いくつかの手法が動的な視点合成に優れた結果を生み出しており、印象的なレンダリング品質を示しています。ただし、高品質のイメージをレンダリングする際のレイテンシーを改善する必要があるという点では、まだ改善の余地があります。この研究論文では、4K4Dという4Dポイントクラウド表現を紹介し、ハードウェアラスタ化をサポートし、迅速なレンダリングを可能にします。

4K4Dは、4つのフィーチャーのベクトルとして、4Dグリッドベースで3Dシーンを表現します。このような表現では、グリッド内のポイントを規則的にし、最適化しやすくします。モデルはまず、入力ビデオのオブジェクトのジオメトリと形状をスペースカービングアルゴリズムとニューラルネットワークを使用して表現し、ポイントクラウドから3Dシーンを表現する方法を学習します。次に、ポイントクラウド表現をレンダリングするために、差分深度ピーリングアルゴリズムが開発され、レンダリングスピードを向上させるためにハードウェアラスタイザが活用されます。

レンダリングスピードを向上させるために、次の加速技術を適用します:

  • 一部のモデルパラメータは事前に計算され、メモリに格納され、グラフィックスカードがシーンを高速にレンダリングできるようにします。
  • モデルの精度を32ビット浮動小数点から16ビット浮動小数点に減らします。これにより、パフォーマンスの損失を見えることなく、FPSが20増加します。
  • 最後に、差分深度ピーリングアルゴリズムに必要なレンダリングパスの数を減らし、品質には見えない変化があるまま、FPSが20増加します。

研究者は、4K4DのパフォーマンスをDNA-Rendering、ENeRF-Outdoorなどの複数のデータセットで評価しました。研究者の3Dシーンのレンダリング方法は、前者のデータセットでは1080pで400 FPS以上、後者のデータセットでは4Kで80 FPSでレンダリングすることができます。これは、最先端のリアルタイム動的視点合成方法ENeRFよりも30倍以上高速であり、さらに優れたレンダリング品質も提供しています。ENeRF Outdoorデータセットは、複数のアクターを含む比較的困難なものですが、4K4Dは他のモデルと比較しても優れた結果を生み出し、一部のレンダリングで画像の端周りに黒いアーティファクトが発生する他のモデルと比較しても、ぼやけた結果を生み出しました。

まとめると、4K4Dは、4K解像度でのリアルタイム視点合成において、遅いレンダリングスピードの問題に対処する新しいメソッドです。これは、状態-of-the-artのレンダリング品質を実現し、レンダリングスピードを30倍以上向上させるニューラルポイントクラウドベースの表現です。ただし、長時間のビデオに対する高いストレージ要件やフレーム間のポイント対応の確立など、いくつかの制限事項があり、研究者は将来の作業でこれらに対処する予定です。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

データサイエンス

「NLP(スクラッチからのdoc2vec)&クラスタリング:テキストの内容に基づいたニュースレポートの分類」

このタイプの分類を行うためには、教師付き学習法(タグ付きのデータセットを使用する方法)、クラスタリングを使用する方法...

機械学習

「大規模な言語モデルを使用した生成型AI:実践トレーニング」

この2時間のトレーニングでは、LLM(Language Model)の概要、その機能、およびそれらを開発・展開する方法について説明しま...

AI研究

「ポーズマッピング技術によって、脳性麻痺の患者を遠隔で評価することができます」

「機械学習の手法は、ほとんどのモバイルデバイスで動作し、医師のオフィス以外の他の運動障害の評価にも拡張することができ...

機械学習

「パフォーマンスと使いやすさを向上させるための機械学習システムにおけるデザインパターンの探求」

機械学習は、最近の進展と新しいリリースにより、ますます広まっています。AIとMLの人気と需要が高まり、製品レベルのMLモデ...

AI研究

この中国のAI研究は「Consistent4D」を紹介します:未キャリブレーションの単眼映像から4Dダイナミックオブジェクトを生成するための新しい人工知能手法

コンピュータビジョンの領域は、視覚的な入力から動的な3Dデータを解読するという基礎的で困難な課題に取り組んでいます。こ...

データサイエンス

「Ego-Exo4Dを紹介:ビデオ学習とマルチモーダルパーセプションに関する研究をサポートするための基礎データセットとベンチマークスイート」

今日、AIはほとんどの想像できる分野で応用されています。それは確かに私たちの生活を変え、プロセスを合理化し、効率を向上...