中国のSJTUの研究者たちは、大規模なLiDARオドメトリ用のウィンドウベースのマスキングされたポイントトランスフォーマーフレームワーク、TransLOを紹介しました

『中国の研究者がSJTUで大規模LiDARオドメトリに適したウィンドウベースのポイントトランスフォーマーフレームワーク「TransLO」を紹介』

上海交通大学と中国矿业大学の研究者たちはTransLOを開発しました。このLiDARオドメトリネットワークは、セルフアテンションとマスクされたクロスフレームアテンションを備えたウィンドウベースのマスクされたポイントトランスフォーマーを統合しています。TransLOは、スパースな点群を効果的に扱うため、無効な動的な点を除外するためにバイナリマスクを使用しています。

この手法では、Iterative Closest Point(ICP)のバリアントや広く使用されているLOAMなど、一般的なLiDARオドメトリの手法について説明しています。また、パフォーマンスの向上のために地面のセグメンテーションを組み込んだLOAMのバリアントに重点を置いています。この研究では、CNNとトランスフォーマーを組み合わせた世界的な特徴埋め込みを実現するため、最初のトランスフォーマーベースのLiDARオドメトリネットワークであるTransLOが紹介されています。射影感知型マスク、ウィンドウベースのマスクされたセルフアテンション(WMSA)、マスクされたクロスフレームアテンション(MCFA)などのコンポーネントは、TransLOの効果を示すアブレーション研究を通じて評価されています。

LiDARオドメトリは、SLAM、ロボットナビゲーション、自動運転などのアプリケーションにおいて重要ですが、従来はICPや特徴ベースの手法に依存していました。CNNなどの学習ベースの手法は、ポイントクラウドにおける長距離の依存関係やグローバル特徴のキャプチャに課題があります。TransLOは、ウィンドウベースのマスクされたポイントトランスフォーマーを使用して、効率的にポイントクラウドを処理し、姿勢推定を予測します。

TransLOは、2D射影、長距離の依存関係をキャプチャするローカルトランスフォーマー、および姿勢推定を予測するMCFAを使用してポイントクラウドを処理します。ストライドベースのサンプリング層とWMSAを使用してポイントクラウドを円柱状の表面に射影します。CNNは受容野を拡大し、射影感知型マスクはポイントクラウドのスパースさに対処します。姿勢ワーピング操作により反復的な改善が行われます。アブレーション研究は、コンポーネントの効果を確認し、TransLOがKITTIオドメトリデータセットで既存の手法を上回ることを示しています。

KITTIオドメトリデータセット上の実験結果は、平均回転RMSEが0.500°/100m、平行移動RMSEが0.993%というTransLOの優れたパフォーマンスを示しています。TransLOは最近の学習ベースの手法を上回り、ほとんどの評価シーケンスでLOAMをも凌駕します。アブレーション研究では、外れ値をフィルタリングするバイナリマスク、フレーム間のソフトな対応関係の確立により、MCFAモジュールが翻訳と回転エラーの改善に貢献していることが強調されています。

提案されたTransLOネットワークは、LiDARオドメトリのためのエンドツーエンドのウィンドウベースのマスクされたポイントトランスフォーマーであり、CNNとトランスフォーマーを統合してグローバル特徴埋め込みと外れ値除去を強化し、KITTIオドメトリデータセット上で最新のパフォーマンスを達成します。主要なコンポーネントには、長距離の依存関係のためのWMSA、外れ値フィルタリングのためのバイナリマスク、フレームの関連付けと姿勢推定におけるMCFAが含まれています。アブレーション研究は、WMSAの重要性、外れ値フィルタリングのためのバイナリマスク、MCFAのモデルの成功における重要な役割を確認しています。TransLOは、大規模な位置特定とナビゲーションにおいて優れた精度、効率、グローバル特徴に焦点を当てています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AIニュース

AWS CDKを介してAmazon SageMakerロールマネージャーを使用して、カスタム権限を数分で定義します

機械学習(ML)の管理者は、MLワークロードのセキュリティと完全性を維持する上で重要な役割を果たしています彼らの主な焦点...

機械学習

「機械学習モデルを展開する」とはどういう意味ですか?

データサイエンスは、ますます多くの企業を引き付け続ける有望な分野ですが、産業化プロセスに統合されるのに苦労しています...

データサイエンス

Salesforce AIとコロンビア大学の研究者が、DialogStudioを導入しましたこれは、80の対話データセットの統一された多様なコレクションであり、元の情報を保持しています

会話AIは近年、著しい進化を遂げ、機械とユーザーの間で人間のような対話を可能にしています。この進歩を推進している重要な...

機械学習

印象的なパフォーマンス:TensorRT-LLMを使用したRTXで最大4倍高速化された大規模言語モデル(LLM) for Windows

Generative AIは、個人コンピューティングの歴史で最も重要なトレンドの一つであり、ゲーミング、創造性、ビデオ、生産性、開...

機械学習

「テンソル量子化:語られなかった物語」

この記事の残りの部分では、具体的な例を用いて以下の質問に答えていきますスケール:浮動小数点範囲を量子化する際、通常、...

機械学習

「グラフ注意ネットワーク論文のイラストとPyTorchによる実装の説明」

グラフニューラルネットワーク(GNN)は、グラフ構造のデータに作用する強力なニューラルネットワークの一種ですノードのロー...