「GPUの加速なしで大規模なシーンをリアルタイムでマッピングできるのか?このAI論文は、高度なLiDARベースの位置特定とメッシュ作成のために「ImMesh」を紹介します」

「GPUの加速なしで大規模なシーンをリアルタイムでマッピングできるのか?AI論文「ImMesh」が高度なリダーベース位置特定とメッシュ作成を紹介!」

実際の世界にマッチする仮想環境を提供することで、メタバース、VR / AR、ビデオゲーム、物理シミュレータを含む3Dアプリケーションの広範な普及が人間の生活スタイルを向上させ、生産効率を向上させています。これらのプログラムは、実際の環境の複雑なジオメトリーを代表する三角形メッシュに基づいています。現在のほとんどの3Dアプリケーションは、オブジェクトモデリングの基本ツールとして、頂点と三角形の面を集めた三角形メッシュに依存しています。 レンダリングとレイトレーシングの最適化と高速化の能力に無鉄砲であり、センサーシミュレーション、高密度マッピングと測量、剛体力学、衝突検出などでも有用です。しかし、現在のメッシュは、大規模なシーンメッシュの大量生産の能力を妨げるCADソフトウェアを使用して作成された優れた3Dモデラーの出力であることがほとんどです。 そのため、3D再構成コミュニティでは、特に大規模なシーンに対して実時間のシーン再構成が可能な効率的なメッシュアプローチの開発が注目されています。

コンピュータ、ロボット工学、3Dビジョンにおける最も困難な課題の1つは、センサー測定から大規模シーンのリアルタイムメッシュ再構成です。これには、近くにある三角形の面でシーン表面を再作成し、エッジで接続する必要があります。幾何学的なフレームワークを高い精度で構築することは、この困難な課題にとって不可欠であり、実世界の表面で三角形の面を再構築することも重要です。

リアルタイムなメッシュ再構成と同時位置推定の目標を達成するために、香港大学と南方科技大学の最近の研究では、ImMeshというSLAMフレームワークが紹介されています。 ImMeshは、正確で効率的な結果を提供するために協力して作動する4つの相互依存モジュールに依存する、細心の注意を払って開発されたシステムです。 ImMeshは、メッシュ再構成と同時にローケライゼーションを達成するためにLiDARセンサーを使用しています。 ImMeshには、以前の研究で構築された新しいメッシュ再構成アルゴリズムであるVoxelMapが含まれています。具体的には、提案されたメッシングモジュールはボクセルを使用して3次元空間を分割し、新しいスキャンからポイントを含むボクセルを迅速に特定することができます。効率的なメッシングの次のステップは、次元を減少させることであり、これによりボクセルごとの3Dメッシュ化の問題が2Dの問題に変換されます。最後の段階では、ボクセル単位のメッシュのプル、コミット、プッシュプロシージャを使用して三角形面をインクリメンタルに再作成します。 チームは、これが従来のCPUを使用して大規模なシーンの三角形メッシュをオンラインで再作成するための最初の公開努力であると主張しています。

研究者は合成データと実世界のデータを使用して、ImMeshの実行時間のパフォーマンスとメッシュ化の精度を徹底的にテストし、その結果を既知のベースラインと比較してどれだけうまく機能するかを確認しました。まず、まとめてデータを収集することで、データ収集中にメッシュが迅速に再構築されていることを確認するために、メッシュのライブビデオデモを示しました。その後、異なるシナリオで4つの別々のLiDARセンサーによって取得された4つの公開データセットを使用して、ImMeshを徹底的にテストしてシステムのリアルタイム能力を検証しました。最後に、実験3でのImMeshのメッシング性能を既存のメッシングベースラインと比較してベンチマークを確立しました。結果によると、ImMeshはすべてのアプローチの中で最高の実行時間パフォーマンスを維持しながら、高いメッシング精度を達成しています。

彼らはまた、LiDARポイントクラウドの補強にImMeshを使用する方法を実証しています。この方法は、生のLiDARスキャンよりも密集して広い視野(FoV)を持つ規則的なパターンで補強ポイントを生成します。アプリケーション2では、彼らは自分たちの作品をR3LIVE ++およびImMeshと組み合わせることで、シーンのテクスチャ再構築の目標を損なうことなく達成しました。

チームは、空間解像度に関してはスケーラブル性に乏しいという大きな欠点を強調しています。固定された頂点密度のため、ImMeshは大きな平らな表面を扱う際に数多くの小さな面を非効率的に再構築する傾向があります。提案されたシステムにはまだループ補正メカニズムがないため、これが2番目の制限です。これは、再訪問領域での累積ローカリゼーションエラーによる徐々のドリフトの可能性があることを意味します。再訪問の問題が発生すると、再構築結果が一貫していないかもしれません。LiDARポイントクラウドを使用したループ識別の最近の作業をこの作業に取り込むことで、研究者はこの問題を克服するのに役立ちます。ループ検出アプローチを利用することで、リアルタイムでループを識別し、ドリフトの影響を軽減し、再構築結果の信頼性を高めるためにループ補正を実装することが可能になります。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

「生成型AI:CHATGPT、Dall-E、Midjourneyなどの背後にあるアイデア」

芸術、コミュニケーション、そして現実の認識の世界は急速に変化しています人間のイノベーションの歴史を振り返ると、車輪の...

AIニュース

「AnthropicがClaude 2を発表:コーディングを革新する次世代AIチャットプログラム」

人工知能スタートアップのAnthropicは、テックジャイアントのGoogleによるバックアップを受けて、人気のあるチャットプログラ...

機械学習

アリババは、2つのオープンソースの大規模ビジョン言語モデル(LVLM)、「Qwen-VL」と「Qwen-VL-Chat」を発表しました

人工知能の絶え間なく進化する領域において、画像理解とテキストインタラクションのギャップを埋めることは常に課題となって...

AI研究

中国の研究者がiTransformerを提案:時間系列予測のためのTransformerアーキテクチャの見直し

トランスフォーマーは、自然言語処理とコンピュータビジョンで大成功を収めた後、スケーリングのルールに従う基本モデルとな...

データサイエンス

「データストーリーテリングとアナリティクスにおける生成AIのインパクトの公開」

導入 データ分析の広大な領域の中で、ゲネラティブ人工知能(GAI)はゲームを変える最も重要な進展の一つです。これは、歴史...

AIニュース

「ビルドの学び方 — Towards AI コミュニティ ニュースレター第2号」

「最近の数日間、OpenAIのドラマを追っていないと見逃しているよ信じられないことが起こったんだ多くの従業員がOpenAIの理事...