「転移学習の非合理的な効果」

「転移学習の非合理的な効果」

Keras Functional APIを使用したマルチ出力予測のための必須ガイド

Image by Gerd Altmann from Pixabay

複雑な深層学習ニューラルネットワークを訓練するには、かなりの計算効率、大量のデータコーパスの利用可能性、および最新の結果を達成するためのより良い特徴学習アーキテクチャが必要です。しかし、これらの要件は、スタートアップ、研究者、および学生の場合にのみ満たされることがあります。最近の深層学習の進歩により、多くの事前学習済みモデルがオープンソース化されています。

人気のある畳み込みニューラルネットワークベースの事前学習済みモデルには、VGG16/19、ResNet、MobileNet、EfficientNet、ResNeXtなどがあります。これらの事前学習済みモデルの重みとアーキテクチャを調整して、さまざまなユースケースで使用することができます。

VGG16ネットワークは、画像を入力として受け取り、多クラス予測(1000クラスのうちの1つ)を行うために使用される人気のある事前学習済みモデルです。

本記事では、Keras Functional APIを使用して複数の予測またはマルチ出力予測を行うユースケースを開発するために転移学習を活用します

問題の設定:

与えられた人物の顔の画像から、年齢、性別、民族性(マルチ出力予測)を予測するモデルを開発することです。

(Image by Author), Birds-eye illustration of the use-case

転移学習を活用し、VGG-16の事前学習済みネットワークを使用して、上記のアーキテクチャをモデリングし、マルチ出力予測を行う必要があります。残念ながら、VGGネットワークは、マルチ出力予測ではなく、マルチクラス予測(1000クラスのうちの1つ)を行うために設計されています。

解決策:

今回の課題は、Keras Functional APIを使用してVGG-16のアーキテクチャを調整して、マルチ出力予測を行うようにすることです。

データセット:

私は、23,000以上の注釈付き顔画像とそれに対応する年齢、性別、民族性を持つKaggleのデータセットを使用します(CC0ライセンスの下でオープンソース化されています)。

データの準備:

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

データサイエンス

「AIがキーストロークを聞く:新たなデータセキュリティの脅威」

ロンドン大学、ダラム大学、サリー大学の研究者によって開発された画期的なAIシステムは、データセキュリティの懸念を新たな...

データサイエンス

「2023年の小売り向けデータストリーミングの状況」

ウォルマート、アルバートソンズ、オットー、AOなどからの小売業におけるデータストリーミングの状況には、オムニチャネル、...

機械学習

「トランスフォーマーの単純化:あなたが理解する言葉を使った最先端の自然言語処理(NLP)— パート1 — イントロ」

「トランスフォーマーは、AIの進歩に大きく貢献したディープラーニングのアーキテクチャですそれはAIとテクノロジー全体の範...

機械学習

なぜGPUはAIに適しているのか

GPUは人工知能の希少な地球の金属、さらには金そのものとも呼ばれています。それは、今日の生成的AI時代において基盤となる存...

AIニュース

ディープサーチ:Microsoft BingがGPT-4と統合

Microsoftは、OpenAIのGPT-4技術と統合した最新機能でオンライン検索を革命化する予定です。このBingの機能強化により、複雑...

データサイエンス

「AIコントロールを手にして、サイバーセキュリティシステムに挑戦しましょう」

あなたの組織のデータは、サイバー犯罪者の悪意のある行為に対して免疫を持っていますか?そうでなければ、弱い防御システム...