プリンストン大学の研究者が、自然界の写実的な3Dシーンの手続き生成器であるInfinigenを紹介しました

Princeton University researchers introduced Infinigen, a procedural generator for realistic 3D scenes in nature.

プリンストン大学の研究チームは、「プロシージャルジェネレーションを使用した無限の写実的な世界」という最近の論文で、画期的なプロシージャルジェネレーターであるInfinigenを紹介しました。この研究は、多様性が限られ、現実世界のオブジェクトの複雑さを捉えることができない既存の合成データセットの制限に対処しています。

Infinigenは完全にプロシージャルなシステムであり、形状、テクスチャ、材料、およびシーンの構成を0から生成することができます。Infinigenの主要な特徴は、粗いおよび細かいジオメトリとテクスチャの詳細をプロシージャルに生成することによって高い写実性を生み出す能力にあります。Infinigenは分離されているため、生成されるすべてのジオメトリ情報は現実世界の参照に基づいており、合成されたシーンの真正性を高めています。

Infinigenのアーキテクチャは、プロシージャルジェネレーションの能力で知られている広く使用されているグラフィックスシステムであるBlenderに基づいて構築されています。研究チームは、自然物体やシーンのカバレッジを拡大するためのプロシージャルルールのライブラリを設計および実装しました。これらのルールはBlenderで利用可能な便利なプリミティブを活用しています。さらに、チームは、BlenderノードグラフをPythonコードに変換する自動変換ツールを含む、プロシージャルルールの作成を簡素化するユーティリティを開発しました。さらに、オブジェクトの深度、遮蔽境界、バウンディングボックス、光学フロー、表面法線、オブジェクトカテゴリ、およびインスタンスセグメンテーションなどの情報を提供するグラウンドトゥルーラベルで合成画像をレンダリングするユーティリティも開発されました。

Infinigenによって生成された合成データの品質を評価するために、チームは広範な実験を実施し、既存の合成データセットおよびジェネレーターと比較しました。これらの実験の結果、Infinigenは外部ソースに頼らずに写実的でオリジナルなアセットやシーンを生成する驚異的な能力を持っていることが示され、現実世界の複雑さをより正確に反映する多様で広範なトレーニングデータセットを生成する可能性を示しています。

Infinigenは、研究者がより広いコミュニティとの協力によって育成することを意図しているオープンソースプロジェクトです。彼らは、すべての現実世界の要素を包括するようにカバレッジを拡大し、その継続的な開発と成長を確保することにコミットしています。Infinigenを無料で提供することで、研究チームは協力を促進し、プロシージャルジェネレーションのさらなる進歩をインスパイアすることを望んでいます。

全体的に、Infinigenの導入は、コンピュータビジョンタスクのための合成データを生成するための重大な進歩を示しています。そのプロシージャルアプローチと写実的なシーンを生成する能力は、既存の合成データセットと現実世界のオブジェクトの複雑さのギャップを埋めることを約束し、さまざまなコンピュータビジョンアプリケーションでモデルをトレーニングするための貴重なツールとなります。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI研究

「産業界が音声AIを活用して消費者の期待に応えている方法」

急速な技術の進歩のおかげで、消費者は前例のないほどの便利さと効率性に慣れてきました。 スマートフォンを使えば、商品を検...

データサイエンス

Amazon SageMaker 上で MPT-7B を微調整する

毎週新しい大規模言語モデル(LLM)が発表され、それぞれが前任者を打ち負かして評価のトップを狙っています最新のモデルの1...

AIテクノロジー

「AIサービスへの大胆な進出:億万長者ビンニー・バンサールの大局変革」

テクノロジーと電子商取引の世界では、Binny Bansalの名前はよく知られています。オンライン小売り大手Flipkartの共同創設者...

AI研究

KAISTのAI研究者が、「KTRL+F」という技術を導入しましたこれは、ドキュメント内で意味的なターゲットをリアルタイムで特定するための知識を補完するコンピューター上の検索タスクです

KTRL+Fタスクは、リアルタイムでドキュメント内の意味的な対象を特定するための知識拡張型インドキュメント検索問題であり、...

機械学習

ソースフリーのドメイン適応における壁の破壊:バイオアコースティクスとビジョン領域へのNOTELAの影響

ディープラーニングは、さまざまなアプリケーション領域で重要な進展を遂げています。その一因は、ますます大規模なデータセ...