ロンドン大学の研究者がDSP-SLAMを紹介:深い形状の事前情報を持つオブジェクト指向SLAM

ロンドン大学の研究者によるDSP-SLAMの紹介:オブジェクト指向SLAMにおける深い形状の事前情報

人工知能(AI)の急速な進展の中で、ディープラーニングはますます人気が高まり、生活をより便利にしています。AIの中で、同時位置推定と地図作成(SLAM)は、ロボット、無人運転車、拡張現実システムなど、あらゆる産業に進出しています。

SLAMは、周囲の環境を再構築し、動くカメラの軌跡を同時に推定するものです。SLAMには、カメラの軌跡を正確に推定し、優れた幾何学的な再構築を行う素晴らしいアルゴリズムがあります。しかし、幾何学的な表現だけでは、より高度なシーン理解を必要とする複雑なタスクにおいて重要な意味情報を提供することはできません。

現在使用されているセマンティックSLAMシステムでは、シーン内のオブジェクトの数、サイズ、形状、相対位置などの具体的な詳細を推論することは難しいです。最近の研究では、ロンドン大学カレッジのコンピュータ科学部の研究チームが、最新のオブジェクト指向SLAMシステムであるDSP-SLAMを紹介しました。

DSP-SLAMは、包括的かつ正確な共同マップを構築するように設計されており、前景オブジェクトは密な3Dモデルで表現され、背景は疎なランドマーク点で表現されます。このシステムは、モノカメラ、ステレオ、またはステレオ+LiDARの入力モダリティでも十分に機能します。

研究チームは、DSP-SLAMの主な機能は、特徴ベースのSLAMシステムによって生成された3Dポイントクラウドを入力として受け取り、特定のオブジェクトを密な再構築する能力を追加することです。オブジェクトの検出にはセマンティックインスタンスセグメンテーションが使用され、カテゴリ固有の深層形状埋め込みがこれらのオブジェクトの形状と位置を推定するための先行情報として使用されています。

研究チームは、DSP対応バンドル調整がシステムの主要な特徴であり、カメラの位置、オブジェクトの位置、特徴点の共同最適化のためのポーズグラフを作成することを強調しています。この戦略を使用することで、シーンの表現方法を改善し最適化し、背景のランドマークと前景のオブジェクトの両方を考慮に入れることができます。

モノカメラ、ステレオ、およびステレオ+LiDARの複数の入力モダリティで秒間10フレームの速度で動作する提案されたシステムは、印象的なパフォーマンスを発揮しました。DSP-SLAMは、KITTIオドメトリデータセットからのステレオ+LiDARシーケンスやFreiburg、Redwood-OSデータセットからのモノカメラRGBシーケンスなど、複数のデータセットでテストされ、その能力が確認されています。不完全な観測にもかかわらず、システムは優れた完全物体再構築と一貫したグローバルマップを保持する能力を示しました。

研究者たちは、主な貢献を以下のように要約しています。

  1. DSP-SLAMは、前景オブジェクトのみを表現する以前の手法とは対照的に、疎な特徴点を使用して背景を再構築することで、オブジェクトに対するセマンティックマッピングの豊かさと特徴ベースのカメラトラッキングの正確さを組み合わせています。
  1. DSP-SLAMは、RGBのみのモノカメラストリームを使用するため、ノード-SLAMではなく、RGBのみのモノカメラストリームを使用しているため、デンスな深度画像に依存する手法よりも優れたパフォーマンスを発揮し、50個の3Dポイントでオブジェクトの形状を正確に推定することができます。
  1. DSP-SLAMは、オブジェクトの形状と位置推定において、事前にベースとなる技術である自動ラベリングを数量的および質的に凌駕しています。
  1. KITTIオドメトリデータセットの実験結果は、DSP-SLAMの共同バンドル調整がトラジェクトリー推定においてORB-SLAM2を凌駕し、特にステレオ+LiDAR入力を使用した場合に優れていることを示しています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AIニュース

「ReactでOpenAIの力を解き放つ:ユーザーエクスペリエンスを革新する」

このブログでは、ReactでOpenAIを使用してユーザーエクスペリエンスを革新する方法を探求しますOpenAIをReactと統合すること...

AI研究

UCLAとCMUの研究者が、優れた中程度範囲の天気予報のためのスキルと信頼性のあるスケーラブルなトランスフォーマーニューラルネットワーク「ストーマー」を紹介しました

現在、科学と社会が直面している主な問題の一つは天気予報です。正確な天気予報は、自然災害や極端な天候事象に対処し、回復...

データサイエンス

データのセキュリティとコラボレーションの強化:AWS Clean Roomsが機械学習と差分プライバシー機能を導入

Amazon Web Services(AWS)は、セキュアなデータ共有サービスであるClean Roomsの新しいアップデートを発表しました。このア...

コンピュータサイエンス

2050年までに、ロボットはワールドカップの優勝者に勝利するか?

ロボカップの夢は、数世代のロボティストたちにインスピレーションを与えてきました

機械学習

ディープラーニングのためのPythonとC++による自動微分

このストーリーでは、トレーニングループ中にパラメータの勾配を自動的に計算する現代のディープラーニングフレームワークの...

データサイエンス

私が通常のRDBMSをベクトルデータベースに変換して埋め込みを保存する方法

この記事では、一般的なRDBMSを完全に機能したベクトルデータベースに変換して、GenerativeAIアプリケーションの開発に埋め込...