マイクロソフトとETHチューリッヒの研究者がLightGlueを紹介

Microsoft and ETH Zurich researchers introduce LightGlue.

コンピュータビジョンの領域では、画像間の対応点のマッチングは、カメラトラッキングや3Dマッピングなどのアプリケーションで重要な役割を果たしています。しかし、これらの方法には制約があり、そこで新しいディープネットワークであるLightGlueが登場します。

ETH ZurichとMicrosoftの共同研究の成果であるLightGlueは、画像マッチングと外れ値の排除を組み合わせたディープネットワークを活用しています。この革新的なアプローチでは、Transformerモデルを組み込んでおり、広範なデータセットを活用して、難しい画像ペアのマッチングを学習します。このアプローチは、屋内外の環境の両方で驚くべき頑健性を実証しています。

LightGlueは、困難な条件下での視覚的な位置特定に優れ、航空写真のマッチング、オブジェクトの姿勢推定、魚の再識別などのタスクでも有望なパフォーマンスを発揮します。この新しいアプローチは、「SuperGlue」の制約を解決することを目指しており、計算効率の低下と大量の計算リソースの需要という問題に苦しんでいました。

この問題を解決するために、チームはLightGlueをより正確で効率的かつ訓練しやすい代替手法として開発しました。緻密なアーキテクチャの修正と限られたリソースで高性能なディープマッチをトレーニングするためのレシピの絞り込みを通じて、チームはわずかなGPU日で最先端の正確性を達成しました。

LightGlueはパレート最適な解を提供します。つまり、効率と正確性の理想的なバランスを取ることができます。従来の手法とは異なり、LightGlueは各画像ペアの難易度に適応します。これは、各計算ブロックの後に対応関係を予測し、さらなる計算のための信頼性を評価することで行われ、マッチングできないポイントは早期に破棄されます。

これにより、関心のある領域に計算リソースを集中させ、効率を向上させることができます。これまでの実験結果は、LightGlueの既存の疎なマッチングや密なマッチングよりも優れていることを示しています。また、ランタイムを大幅に削減しながら、局所特徴からのマッチングを提供します。

LightGlueの開発により、同時位置特定とマッピング(SLAM)などのレイテンシに敏感なアプリケーションでのディープマッチの展開が可能になります。また、クラウドソーシングされたデータからより大規模なシーンの再構築も可能です。

興味深いことに、LightGlueのモデルとトレーニングコードは、許容ライセンスのもとで一般に公開されます。このリリースにより、研究者や実践者がLightGlueの機能にアクセスできるだけでなく、効率的かつ正確な画像マッチングを必要とするコンピュータビジョンの応用の進展に向けた貢献を奨励します。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

データサイエンス

クラウドコンピューティングとウェアラブルデバイス:強力な組み合わせ

クラウドコンピューティングは、データの保存と処理によってウェアラブルデバイスを強化し、リアルタイムの接続性とスケーラ...

AI研究

ビンガムトン大学の研究者たちは、社会的な写真共有ネットワークでの自分たちの顔の管理を可能にするプライバシー向上の匿名化システム(私の顔、私の選択)を紹介しました

匿名化は、顔認識や識別アルゴリズムの文脈において重要な問題です。これらの技術の商品化が進むにつれて、個人のプライバシ...

機械学習

「BeLFusionに出会ってください:潜在的拡散を用いた現実的かつ多様な確率的人間の動作予測のための行動的潜在空間アプローチ」

人工知能(AI)が世界を魅了し続ける中で、コンピュータビジョンとAIの交差点において、人間の動き予測(HMP)という注目すべ...

機械学習

PyRCAをご紹介します:AIOpsにおけるRoot Cause Analysis(RCA)のために設計されたオープンソースのPython Machine Learningライブラリです

人工知能(AI)および機械学習の分野は、その信じられないほどの能力とほとんどすべての産業での使用例のおかげで急速に進化...

AI研究

「AIの画像をどのように保存すべきか?Googleの研究者がスコアベースの生成モデルを使用した画像圧縮方法を提案」

1年前、AIによるリアルな画像生成は夢でした。ほとんどの出力が3つの目や2つの鼻などを持つものであるにもかかわらず、実際の...

AIニュース

「従業員は職場でChatGPTを望む上司は秘密を漏らすことを心配している」

一部の企業リーダーは、会社や顧客の機密情報が公開されることへの懸念から、生成型人工知能ツールの使用を禁止しています