画像拡張のための生成的対立ネットワーク(GAN)

GAN for image augmentation

顔にメガネを追加するための画像変換用カスタマイズGANの設計

UnsplashのAnnie Sprattによる画像

クイックノート: 私はまもなく難しいOMSCS修士プログラムを開始します。そのため、私は頻繁には書けなくなります。ただし、前の学期で学んだ科目については、休みごとに戻って書く予定です。たとえば、最初の学期を終えた後、12月には強化学習(RL)について書くことが予想されます。したがって、特に将来OMSCSを受ける予定の方々には、ぜひ注目してください!

最近、私は個人の時間で生成的対抗ネットワーク(GAN)をいじっています。得られた知見は、私の専門的な仕事にも活かすことができるかもしれません。私の専門的な役割では、顔認識システムをゼロから構築しており、特に画像拡張の技術としてGANは非常に有用です。以前の記事では、データ中心のAIとデータ拡張・収集の異なる戦略について共有しました。

データ中心のAI — データ収集と拡張戦略

データ中心の機械学習プロジェクトのデータ生成戦略に関する包括的なガイド

pub.towardsai.net

画像拡張の方法の1つで、私は既にGANを使用できるテクニックとして簡単に触れました。したがって、この記事ではさらに詳しく説明します。GANについてはあまり深い知識はありませんが、まだCourseraのGAN専門化コースを受けていないためです。私のGANに関する理解は、主にTensorFlow: Advanced Techniques専門化コースで得たスキルに基づいています。それにもかかわらず、私が知っていることを活用して、この記事では、非メガネをかけていない顔にメガネを追加するためのオリジナルでカスタマイズされたGANモデルと成功した動作するソリューションを紹介します。

さあ、さっそく始めましょう!

1. 生成対抗ネットワーク(GAN)の概要

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

キャルレールの最高製品責任者、ライアン・ジョンソンへのインタビューシリーズ

ライアンは、初期のスタートアップからフォーチュン100の組織まで、多様なテクノロジーと製品開発のリーダーシップ経験を15年...

人工知能

ムーバブルインクのCEO兼共同創設者であるヴィヴェク・シャルマ氏についてのインタビュー・シリーズ

ビヴェクは2010年にムーバブルインクを共同設立し、急速な成長を遂げながら、600人以上の従業員を擁し、世界有数の革新的なブ...

データサイエンス

「3つの質問:ロボットの認識とマッピングの研磨」

MIT LIDSのLuca CarloneさんとJonathan Howさんは、将来のロボットが環境をどのように知覚し、相互作用するかについて議論し...

人工知能

ピーター・マッキー、Sonarの開発者担当責任者-インタビューシリーズ

ピーター・マッキーはSonarのDeveloper Relationsの責任者です Sonarは、悪いコードの1兆ドルの課題を解決するプラットフォー...

機械学習

「Prolificの機械学習エンジニア兼AIコンサルタント、ノラ・ペトロヴァ – インタビューシリーズ」

『Nora Petrovaは、Prolificの機械学習エンジニア兼AIコンサルタントですProlificは2014年に設立され、既にGoogle、スタンフ...

人工知能

スコット・スティーブンソン、スペルブックの共同創設者兼CEO- インタビューシリーズ

スコット・スティーブンソンは、Spellbookの共同創設者兼CEOであり、OpenAIのGPT-4および他の大規模な言語モデル(LLM)に基...