MVDreamによる3Dモデル生成の革命化

MVDreamによる3Dモデル生成の革命化' (Revolutionizing 3D model generation with MVDream)

最初に louisbouchard.ai で公開され、私のブログでは2日前に読まれました!

ビデオをご覧ください:

この新しいAIモデルを皆さんと共有できることをとても嬉しく思っています!テキスト生成や画像生成については、さまざまな新しいアプローチが見られましたが、ますます進化しています。また、テキストからビデオや3Dモデルを生成するための素晴らしい初期の作品も見られました。たった一文しか持っていない状況で、現実世界のオブジェクトのように見えるものを生成するというタスクの複雑さを想像してみてください。さて、ここには単なる初歩的なステップではなく、テキストから3Dモデルを生成するための大きな進歩があります:MVDreamです!

テキスト:Mormookieeのスタイルでbaby yodaを生成した結果の比較(MVDreamは完全右側)。論文からの画像。

MVDreamは物理を理解できているようですね。以前のアプローチと比較して、それを理解しています。どの視点から見ても、実際の耳が2つであるべきであり、どの視点からも可能性のある耳が2つあるべきではありません。たったこの一文のテキストから非常に高品質な3Dモデルを生成することになります!これはどれほどクールなことでしょう!しかし、さらにクールなのは、その仕組みです… それでは、さっそく見ていきましょう!

3Dモデルを見ると、最大の課題は、それを見ている視点から現実的で高品質な画像を生成することです。そして、それらの視点は空間的に一貫している必要があります。前述した4つの耳のヨーダや多顔の被写体のように、イメージデータセットでは背面の人物がほとんど存在しないため、モデルはなんとしてでも顔を見たがる傾向があります。3Dモデルを生成する主なアプローチのひとつは、カメラからの視点角度をシミュレートし、その視点から見えるものを生成することです。これは2Dリフティングと呼ばれています。つまり、通常の画像を生成し、それらを組み合わせて完全な3Dシーンを作成します。その後、オブジェクトの周りから可能なすべての視点を生成します。そのため、このモデルは一度に1つの視点を生成しようとしており、3D空間での全体的なオブジェクトを十分に理解していないため、これらのような奇妙なアーティファクトが見られるのです。さて、MVDreamはこの方向性で大きな進歩を遂げました。彼らは…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

「トリントの創設者兼CEO、ジェフ・コフマンへのインタビューシリーズ」

ジェフ・コーフマンは、ABC、CBS、CBCニュースで30年のキャリアを持った後、Trintの創設者兼CEOとなりましたジェフは手作業の...

人工知能

スコット・スティーブンソン、スペルブックの共同創設者兼CEO- インタビューシリーズ

スコット・スティーブンソンは、Spellbookの共同創設者兼CEOであり、OpenAIのGPT-4および他の大規模な言語モデル(LLM)に基...

人工知能

「ナレ・ヴァンダニャン、Ntropyの共同創設者兼CEO- インタビューシリーズ」

Ntropyの共同創設者兼CEOであるナレ・ヴァンダニアンは、開発者が100ミリ秒未満で超人的な精度で金融取引を解析することを可...

AIテクノロジー

「LXTのテクノロジーバイスプレジデント、アムル・ヌール・エルディン - インタビューシリーズ」

アムル・ヌール・エルディンは、LXTのテクノロジー担当副社長ですアムルは、自動音声認識(ASR)の文脈での音声/音響処理と機...

人工知能

ベイリー・カクスマー、ウォータールー大学の博士課程候補 - インタビューシリーズ

カツマー・ベイリーは、ウォータールー大学のコンピュータ科学学部の博士課程の候補者であり、アルバータ大学の新入教員です...

人工知能

ピーター・マッキー、Sonarの開発者担当責任者-インタビューシリーズ

ピーター・マッキーはSonarのDeveloper Relationsの責任者です Sonarは、悪いコードの1兆ドルの課題を解決するプラットフォー...