「ニューヨーク大学の研究者が、人の見かけの年齢を画像内で変える新しい人工知能技術を開発しましたが、その人の独自の識別特徴を維持します」

ニューヨーク大学の研究者が、人の見かけの年齢を変える新しい人工知能技術を開発しましたが、独自の識別特徴を維持します

AIシステムは、画像解析を使用して個人の年齢を正確に推定および変更するために、ますます使用されています。老化の変動に堅牢なモデルを構築するには、多くのデータと高品質の長期データセットが必要です。長期データセットとは、数年にわたって収集された多数の個人の画像を含むデータセットのことです。

多くのAIモデルがこのようなタスクを実行するために設計されていますが、多くの場合、個人の顔の特徴を保持しながら年齢属性を効果的に操作することに課題を抱えています。これらのシステムは、多くの年間を通じて個人を示す画像の大規模なトレーニングデータセットの作成という典型的な課題に直面しています。

NYU Tandon School of Engineeringの研究者たちは、個人の一意の生体認証情報を保持しながら、画像内の人物の見かけの年齢を変更するための新しい人工知能技術を開発しました。

研究者たちは、各個人の少数の画像セットでモデルをトレーニングしました。また、別の画像セットを使用して、キャプションによってその人物の年齢カテゴリ(子供、ティーンエージャー、若者、中年、老人、高齢者)が示された画像を収集しました。この画像セットには、有名人の生涯を通じてキャプチャされた画像が含まれており、キャプション付きの写真はモデルに画像と年齢の関係を説明します。その後、トレーニングされたモデルは、テキストプロンプトを介して目標の年齢を指定することによって、エージングまたはデエージングのシナリオをシミュレートするために使用できるようになりました。これらのテキストプロンプトは、画像生成プロセスでモデルをガイドします。

研究者たちは、事前にトレーニングされた潜在拡散モード、個人の身元特定情報を学習するための20枚の顔のトレーニング画像の小さなセット、および画像とそのキャプションの関連性を理解するための600組の画像キャプションの補助的なセットを使用しました。

彼らは適切な損失関数を使用してモデルを微調整しました。また、画像にランダムな変動やノイズを加えたり、取り除いたりしました。さらに、研究者は「DreamBooth」という技術を使用して、ニューラルネットワークコンポーネントの融合によって、人間の顔の画像を徐々に制御された変換プロセスで操作しました。

彼らは、他の年齢変更技術と比較してモデルの正確性を評価しました。この評価を行うために、26人のボランティアに対して生成された画像を同じ個人の実際の写真と関連付けるように依頼しました。さらに、顕著な顔認識アルゴリズムであるArcFaceを使用した比較も行いました。その結果、彼らの方法は優れたパフォーマンスを示し、他の技術のパフォーマンスを上回り、不正な拒否の頻度を最大で44%削減しました。

研究者たちは、トレーニングデータセットに中年のカテゴリの画像が含まれている場合、生成された画像はさまざまな年齢グループを効果的に表現することを発見しました。一方、トレーニングセットには主に高齢者の画像が含まれている場合、モデルは逆の極端な範囲(子供のカテゴリなど)に属する画像を生成しようとする際に課題に直面します。さらに、生成された画像は、トレーニング画像をより古い年齢グループに変換する能力を男性と比較して特に示しています。この不一致は、トレーニング画像にメイクが含まれていることに起因する可能性があります。逆に、人種や民族の変動は生成された出力には顕著で識別できる効果をもたらしませんでした。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI研究

「生成AIが新しいタンパク質の構造を想像する」

MITの研究者たちは、「FrameDiff」という計算ツールを開発しましたこのツールは生成AIを使用して新しいタンパク質構造を作り...

人工知能

「両方の世界のベスト:人間の開発者とAIの協力者」

「これは、開発者を対象とした生成型AI生産性ツール(例:Github Copilot、ChatGPT、Amazon CodeWhisperer)が構造にどのよう...

AIニュース

「マイクロソフトのBing ChatがChromeとSafariに拡大」

マイクロソフトのBing Chatは、AIパワードチャットボットであり、マイクロソフト専用の制約から脱出し、非マイクロソフトのブ...

データサイエンス

2023年の機械学習研究におけるトップのデータバージョン管理ツール

生産に使用されるすべてのシステムはバージョン管理する必要があります。ユーザーが最新のデータにアクセスできる単一の場所...

機械学習

「簡単な英語プロンプトでLLMをトレーニング!gpt-llm-trainerと出会って、タスク固有のLLMをトレーニングする最も簡単な方法」

大規模な言語モデル(LLM)と呼ばれるAIの形式は、人間と同等のテキストを生成することが証明されています。しかし、LLMの訓...

データサイエンス

BERTopicを使用したクラスごとのトピック

「私たちには何十万ものテキストがありますそれらをすべて読んで洞察を得るには数年かかるでしょう幸いなことに、このプロセ...