初心者のための畳込みニューラルネットワーク

美容ファッションの初心者向け:畳み込みニューラルネットワーク入門ガイド

畳み込みニューラルネットワークの基礎

Image from unsplash.com

この記事は、トップテクノロジー企業での就職を目指すプロフェッショナルのために、Interview Kickstartで行った講義の準備の一環として書かれました。インタビューの準備をしている方や基礎を強化したい方にも役立つかもしれません。

この記事では、畳み込みニューラルネットワークとその基礎について説明します。まずは畳み込み演算とは何かから始め、畳み込み層と畳み込みネットワークの構築方法を見ていきます。

では、始めましょう。

畳み込みニューラルネットワーク(CNN)は、複数の「畳み込み層」から構成されています。これらの層は「畳み込み演算」を実行します。畳み込みは信号処理や画像処理の基本演算です。まずはこの演算が何を意味するのかを見てみましょう。

畳み込み演算とは何ですか?

畳み込みは、カーネル(フィルタ)と入力特徴マップの間で行われる数学的な演算です。

カーネルは通常、3×3や5×5などの小さな行列です。入力は常に高さ、幅、チャネルを持つ特徴マップです。畳み込み演算の仕組みは、カーネルが入力上をスライドしながら、カーネルと入力の局所領域の内積を計算することです。この内積の乗算と合計により、出力特徴マップの1つの値が生成されます。

フィルタがすべての位置をスライドすると、出力特徴マップと呼ばれる2Dの活性化マップが生成されます。イメージまたは入力特徴マップ上でフィルタ(カーネル)をスライドさせるたびに、要素ごとの内積を計算して合計します。これにより、出力マップのエントリが1つ生成されます。

convolution operation — image by author

次に、フィルタを右にスライドして入力マップの別の局所領域に適用すると、出力マップへの別のエントリが生成されます。

convolution operation — image by author

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more