3Dインスタンスセグメンテーションにおける境界の打破:改善された疑似ラベリングと現実的なシナリオを備えたオープンワールドアプローチ

3Dインスタンスセグメンテーションにおける境界の打破:改善された疑似ラベリングと現実的なシナリオを備えたオープンワールドアプローチの美しさとファッションの専門性' (3Dインスタンスセグメンテーションにおける境界の打破:改善された疑似ラベリングと現実的なシナリオを備えたオープンワールドアプローチの美しさとファッションの専門性)

オブジェクトインスタンスレベルの分類と意味的なラベリングを提供することにより、3D意味インスタンスセグメンテーションは、点群またはメッシュで表される与えられた3Dシーン内のアイテムを識別しようとするものです。ロボット、拡張現実、自動運転など、3D空間でのオブジェクトのセグメンテーションの能力に依存する多くのビジョンアプリケーションがあります。深度データの収集に使用されるセンサーの進歩に伴い、文献で説明されているインスタンスレベルの注釈の付いた多数の3Dデータセットがあります。大規模な3Dデータセットの利用可能性と深層学習技術の進歩を受けて、最近では多くの3Dインスタンスセグメンテーションの戦略が提案されています。

公にアクセス可能なデータセットへの依存度による3Dインスタンスセグメンテーションシステムの主な欠点は、事前に決められたアイテムラベル(ボキャブラリー)の学習です。しかし、実際の世界にはたくさんのオブジェクトクラスがあり、推論には多くの未知または不明なクラスが含まれる可能性があります。未知のクラスは現在の技術では学習セットには含まれず、またバックグラウンド要素として扱われます。これにより、知識のある識別アルゴリズムは、背景要素ではない未識別または異常な物体を認識することができません。最近の研究では、未知のアイテムの検出の重要性により、2Dオブジェクト識別のためのオープンワールド学習の設定が調査されています。

モデルはオープンワールド環境で未知のアイテムを認識することを目指しています。新しいクラスにラベルが付けられると、新しいセットは再学習せずに徐々に学習されることが望ましいです。以前のアプローチは主にオープンワールド2Dオブジェクト識別に推奨されてきましたが、3D領域ではまだ調査されていません。アイテムが3Dでどのように見え、背景と他のオブジェクトカテゴリから分離されるかを理解することが最大の課題です。図1の3Dインスタンスセグメンテーションは、オープン環境で未知のオブジェクトを認識し、これらの新しいクラスのアノテーションについてオラクルに質問することができるため、モデルにより柔軟性が提供されます。さらなるトレーニングのため。

図1: オープンワールド3Dインスタンスセグメンテーション。モデルは各反復学習フェーズで新しいアイテムを発見し、人間オペレーターはこれらのいくつかにラベルを割り当てて現在の知識ベースに追加し、引き続きトレーニングします。

しかし、この戦略にはいくつかの欠点があります。優れた擬似ラベリング手法が必要な要素が3つあります:(i)未知のクラスの注釈の欠如、(ii)既知のクラスと未知のクラスの予測された特徴の類似性、および(iii)3Dポイントクラウドのための優れたオブジェクト性スコアリング方法の必要性。この研究では、Mohamed Bin Zayed University of Artificial Intelligence(MBZUAI)、Aalto University、Australian National University、およびLinköping Universityの研究者が、オープンワールド屋内3Dインスタンスセグメンテーションと呼ばれる独自の問題設定を調査します。これにより、新しいクラスを徐々に追加しながら、未知のクラスのオブジェクトをセグメンテーションしようとします。彼らは3Dインスタンスセグメンテーションのオープンワールド環境での調査では、彼らの技術とオラクルとのパフォーマンスギャップを埋めるための提案されたソリューションの価値を多数のテストで証明しています。

彼らの研究には以下の主な貢献があります:

• 彼らは、特定の機構を持つオープンワールド3D屋内インスタンスセグメンテーション手法を提供し、3D未知のアイテムを正確に識別するための特別な自動ラベリング手法を使用します。トレーニング中に既知のクラスラベルと分からないクラスラベルを区別するための擬似ラベルを生成するために、確率的に補正された未知のクラスラベルを使用します。また、オブジェクト性スコアの分布に基づいて未知のクラスの可能性を修正することにより、推論時の擬似ラベルの品質をさらに向上させます。

• オープンワールド3D屋内セグメンテーションの徹底的な評価のために、彼らは知られたクラスと未知のクラス、および200以上のコースにわたるインクリメンタル学習を持つ慎重に選択されたオープンワールド分割を提示します。彼らの提案された分割では、オブジェクトクラスの固有分布(頻度ベース)、室内空間を探索する際の異なるクラスタイプ(領域ベース)、および外部世界でのオブジェクトクラスのランダム化など、さまざまな現実的な状況が使用されています。多くのテストは、彼らの手法とオラクルとのパフォーマンスギャップを縮めるための提案されたソリューションの価値を証明しています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

スマートインフラストラクチャのリスク評価における人間とAI・MLの協力

「人間の専門知識、AIの洞察、およびMLアルゴリズムをシナジー効果を発揮させることで、より安全で適応性のある都市システム...

AIニュース

「GPT-4とXGBoost 2.0の詳細な情報:AIの新たなフロンティア」

イントロダクション AIは、GPT-4などのLLMの出現により、人間の言語の理解と生成を革新し、大きな変化を経験しています。同時...

データサイエンス

リトリーバル オーグメンテッド ジェネレーション(RAG)推論エンジンは、CPU上でLangChainを使用しています

「リトリーバル増強生成(RAG)は広範にカバーされており、特にチャットベースのLLMへの応用については詳しく語られています...

AIニュース

「GPT-5がOpenAIによって商標登録されました:それがChatGPTの未来について何を示しているのでしょうか?」

「GPT-5とは何ですか?また、OpenAIがなぜそれに商標を取得したのでしょうか?人工一般知能(AGI)に向けた次のステップとな...

人工知能

リアルタイムなSlackボットを生成的AIで構築する

「Apache NiFi、LLM、Foundation Models、およびストリーミングを使用して、クールなSlackbotを構築する方法を学びましょうモ...

人工知能

Segmind APIとPostmanを使用した簡単なGenAIアプリの統合

はじめに 人工知能(AI)をアプリケーションに統合することは、ビジネス競争力を維持するためにますます必要になっています。...