コンセプトグラフの紹介:3Dシーンのためのオープンボキャブラリーグラフ構造表現

美容とファッションのエキスパートがおすすめする:ビビッドで活気に満ちたコンセプトグラフの紹介:3Dシーンを演出するためのオープンボキャブラリーグラフ構造表現

視覚シーンに関する情報をキャプチャして符号化することは、コンピュータビジョン、人工知能、またはグラフィックスのコンテキストで、シーン表現と呼ばれます。これには、オブジェクト、その位置、サイズ、色、関係など、シーンに存在する要素と属性の構造化または抽象化された表現の作成が含まれます。ロボットは環境をナビゲートする際に、ボード上のセンサからこれらの表現をオンラインで構築する必要があります。

これらの表現は、シーンのボリュームとロボットの動作時間の維持のためにスケーラブルで効率的でなければなりません。オープンライブラリはトレーニングセッションの事前定義されたデータに制限されるべきではなく、推論中に新しいオブジェクトや概念を処理できる必要があります。これには、密な幾何情報の収集やタスク計画のための抽象的な意味情報など、さまざまなタスクの範囲での計画を可能にする柔軟性が要求されます。

上記の要件を含めるために、トロント大学、MIT、モントリオール大学の研究者は、ロボットの知覚と計画のための3Dシーン表現手法であるConceptGraphsを提案しています。基礎モデルを使用して3Dシーン表現を取得する従来のプロセスでは、インターネットスケールのトレーニングデータが必要であり、3Dデータセットも比較可能なサイズである必要があります。

これらの表現は、冗長な意味特徴ベクトル上のすべてのポイントに基づいており、必要以上のメモリを消費し、大きなシーンにスケーラビリティを制限しています。これらの表現は密であり、マップ上で動的に更新することができないため、分解することが容易ではありません。チームによって開発された手法は、ノード表現を持つグラフ構造でシーンを効率的に記述できます。階層的な3Dシーン表現を構築できるリアルタイムシステムに構築することができます。

ConceptGraphsは、3Dマッピングシステムからの幾何学的データと2D基礎モデルからの意味的データを統合するオブジェクト中心のマッピングシステムです。したがって、画像と言語の基礎モデルによって生成された2D表現を3Dの世界に結びつけるこの試みは、言語によるオブジェクトの位置づけ、3Dの推論、およびナビゲーションなどのオープンな語彙タスクで印象的な結果を示します。

ConceptGraphsは、認識と計画のためのオープンな語彙の3Dシーングラフと構造化された意味抽象を効率的に構築することができます。研究チームはまた、ConceptGraphsを現実世界の車輪式および脚式ロボットプラットフォームに実装し、これらのロボットが抽象的な言語クエリのタスクプランニングを容易に実行できることを実証しました。

提供されたRGB-Dフレームを使用して、チームはクラス非依存のセグメンテーションモデルを実行して候補オブジェクトを取得します。幾何学的および意味的な類似度測定を使用して、複数のビューでそれらを関連付け、3Dシーングラフ内にノードをインスタンス化します。次に、各ノードにキャプションを付けるためにLVLMを使用し、隣接ノード間の関係を推論し、シーングラフ内にエッジを構築します。

研究者は、将来の研究ではモデルに時間的なダイナミクスを統合し、構造化されていないより複雑な環境でのパフォーマンスを評価する予定です。最後に、彼らのモデルは、密な暗黙的な表現の既存の景観の主要な制限に対処しています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

「IntelのOpenVINOツールキットを使用したAI最適化と展開のマスタリング」

イントロダクション 人間の労働力を置き換えるAIの影響が増しているため、私たちはほぼ毎日AIについて話題にしています。AIを...

データサイエンス

QRコードに飽きた?独自のフィジュアルマーカーを作りましょう

「QRコードを置き換えるためにフィドゥシャリマーカーを作成する方法を学びましょう:設計から検出まで、解読を通して、すべ...

AIニュース

「3つの医療機関が生成型AIを使用している方法」

「Med-PaLM 2および他の生成型AIソリューションを使用するGoogle Cloudのヘルスケア顧客を紹介します」

機械学習

テキスト生成の評価におけるベクトル化されたBERTScoreのビジュアルガイド

『AIベースのテキスト生成は明らかに主流に入ってきています自動化されたライティングアシスタントから法的文書の生成、マー...

AI研究

「IBMの「脳のような」AIチップが、環境にやさしく効率的な未来を約束します」

興味深い進展として、テクノロジー巨人IBMが人工知能(AI)の世界を革新するかもしれない「脳のような」チップのプロトタイプ...

データサイエンス

データを中心に:Srikanth Velamakanniと共にデータドリブンの組織を築く

Analytics Vidhyaの「データを活用したリーダーシップ(Leading With Data)」は、業界のリーダーが自身の経験、キャリアの道...