「韓国のAI研究がマギキャプチャを紹介:主題とスタイルの概念を統合して高解像度のポートレート画像を生成するための個人化手法」

Korean AI research introduces MagiCapture a personalized method integrating the concepts of subject and style to generate high-resolution portrait images.

人々はよく、履歴書や結婚式などに適した高品質の肖像写真を作成するために、写真スタジオに通ったり、高価で時間のかかる画像編集手続きに従ったりする必要があります。ただ数枚の自撮り写真や参考写真を使用して、パスポートやプロフィール写真などの特定のスタイルで高品質の肖像写真を手に入れることができる状況を想像してみてください。この論文では、この手続きを自動化します。大規模なテキストから画像へのモデル(Stable DiffusionやImagenなど)の最近の進歩により、高品質でリアルな肖像写真が実現可能になりました。これらのモデルをカスタマイズする現在の研究では、利用可能なトレーニング写真を使用して特定の主題や美学を組み合わせることを目指しています。

この論文では、マルチコンセプトのカスタマイズチャレンジを目指しています。ソース素材と参考スタイルがそれぞれ学習された後、合成された出力が生成されます。テキストによる編集ではなく参考写真を使用することで、細かいアドバイスを提供することができ、この目的により適しています。しかし、以前のパーソナライズ技術の期待される結果にもかかわらず、リアリティを欠いた視覚的なものや商業的に実用的ではないものがしばしば現れます。これは、わずか数枚の写真で大規模なモデルのパラメータを更新しようとする際に一般的に起こります。組み合わせた概念のためのグラウンドトゥルース写真が不足しているマルチコンセプト生成では、異なる概念の人工的な混合や元の概念からの転換がより明白になるため、品質の低下はさらに顕著です。

人間のバイアスによる固有の問題により、肖像写真の制作において人工的なアーティファクトやアイデンティティの変化が明らかになります。この問題が最も顕著なのは、マジカプチャ(KAIST AIとSogang大学の研究者によるマルチコンセプトのカスタマイズアプローチ)がこれらの問題の解決策として提案されています。彼らのアプローチでは、合成プロンプト学習が使用され、合成プロンプトがトレーニングプロセスの一部として含まれ、ソース素材と参考スタイルの密な統合を強化しています。このために、補助損失と偽のラベルが使用されます。彼らはまた、Attention Refocusing損失を提案し、マスク付きの再構築目標と組み合わせることを提案しています。これは、情報の分離と推論中の情報の漏洩を避けるために重要な戦術です。マジカプチャは、定量的および定性的評価において他のベースラインよりも優れたパフォーマンスを発揮し、わずかな調整で他の非人間のオブジェクトにも適用できます。

以下は、彼らの論文の主な貢献です:

• ソースと参考写真の特徴を正確に再現する高解像度の肖像写真を生成することができるマルチコンセプトのパーソナライズ技術を提供します。

• 入力画像から必要な情報を分離し、生成中に情報の漏洩を防ぐためのマスク付き再構築目標を持つ、新しいAttention Refocusing損失を提供します。

• ソース素材と参考スタイルを効果的に統合するために、補助損失と擬似ラベルを使用する構成プロンプト学習戦略を提供します。彼らの方法は、定量的および定性的評価において既存のベースライン手法を上回り、わずかな修正で非人間の物体の写真を作成するためにも適用できます。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

「Google DeepMindが大規模な言語モデルを使用して解けない数学問題を解決」

彼らは生産物のほとんどを捨てなければならなかったが、ゴミの中には金があった

AIテクノロジー

AIの闇面──クリエイターはどのように助けを提供できるのか?

最近、AIツールが驚くべきことを成し遂げたという知らせを聞かない日はありませんはい、私たちは未知の領域にいますAI革命は...

AI研究

プリンストン大学の研究者が、自然界の写実的な3Dシーンの手続き生成器であるInfinigenを紹介しました

プリンストン大学の研究チームは、「プロシージャルジェネレーションを使用した無限の写実的な世界」という最近の論文で、画...

AIニュース

「全てのOECDおよびG20加盟国において、インドがAIスキルと人材で1位にランクされました」

技術の絶え間ない進化の中で、一つのスキルが輝く存在となりました。それが人工知能(AI)です。インドはその膨大な技術労働...

データサイエンス

データサイエンティストとして成功するために必要なソフトスキル

データサイエンティストとしてのキャリアを構築する際には、ハードスキルにフォーカスすることが簡単です非線形カーネルを持...

機械学習

一緒にAIを学びましょう−Towards AIコミュニティニュースレター#5

おはようございます、AI愛好家の皆さん!今週のポッドキャストのエピソードは必聴で、これまでの24エピソードの中でも一番優...