ディープネットワークの活性化関数の構築

ディープネットワークの活性化関数構築

AI生成画像(craiyon)

深層ニューラルネットワークの基本的な要素は、活性化関数(AF)です。活性化関数はネットワーク内のノード(「ニューロン」)の最終出力を形成する非線形関数です。一般的な活性化関数には、シグモイド、双曲線正接(tanh)、および整流線形ユニット(ReLU)があります。

ほとんどの場合、ネットワークビルダーは新しい学習アルゴリズムやアーキテクチャなどを考案しながら、標準的な活性化関数を使用し続けます。

最近の2つの研究では、活性化関数に焦点を当て、それらを変更した場合に何が起こるかを調べました。

「ニューラルネットワークにおけるアクティベーション関数のアラカルト選択」という論文では、複数の既知の活性化関数を成功したネットワークアーキテクチャに組み合わせました。これは、最新の自動ハイパーパラメータ最適化ソフトウェアフレームワークであるOptunaを使用して行いました。

では、ハイパーパラメータとはどのような関係があるのでしょうか?実際には、ハイパーパラメータの定義はコーダーであるあなたに依存します。私はPyTorchの48の可能な活性化関数のリストをOptunaに「与えました」。

これらのうち、一部は「公式に」活性化関数として定義されています(たとえばReLUやSigmoidなど)、他のものはテンソル上の数学的な関数です(たとえばAbsやSinなど)。更に、私は研究文献で見つけた4つの新しい活性化関数も組み合わせに加えました。

Optunaには、これらのリストをハイパーパラメータとして処理するようにしました。具体的には、5層ニューラルネットワークと10層ニューラルネットワークでOptunaを実行し、それぞれ5つまたは10個の活性化関数の最も優れたリストを見つけることがOptunaのタスクでした。

この方法は、ReLU隠れユニットとsoftmax出力ユニットで構成される標準的なネットワークと比較して、25の分類問題でより優れた結果をよく生み出すことができることを示しました。

私の卒業生であるRaz Lapidと共に執筆した「Deep Learningを基盤とした画像分類のためのアクティベーション関数の進化」という論文では、新しい活性化関数を生成する方法について調査しました。私たちは遺伝的プログラミングという強力な進化アルゴリズムを使用し、グラフが自然選択による進化をシミュレートするプロセスで進化させました。

たとえば、次のグラフはよく知られたシグモイド活性化関数を表しています。

進化アルゴリズムには、新しい活性化関数を構成するためのプリミティブのセットが与えられました。

基本的なビルディングブロックとして、標準的な活性化関数や基本的な数学関数を使用し、進化によって新しい可能性のある組み合わせを発見するために進化を進めました。これらの新しい組み合わせが新しい活性化関数です。

また、共進化として知られる方法を使って、進化する活性化関数の3つの集団を使用しました。これは、入力層用の活性化関数の集団、出力層用の活性化関数の集団、およびすべての隠れ層用の活性化関数の集団を保持するというものです。私たちは、ニューラルネットワークに関与する場合にはこれが意味があると考えました。

私たちは4つの画像データセットでこの方法をテストし、共進化(および「通常の」進化)が実際にうまく機能し、標準的な活性化関数と比較してネットワークのパフォーマンスを向上させる良い活性化関数を見つけることができることを発見しました。さらに、異なるネットワークステージで異なる活性化関数を使用することが有益であることも示しました。

進化についてもっと詳しく知りたい場合は、私の他のVoAGIの記事を参照してください。

進化アルゴリズム、遺伝的プログラミング、および学習

進化アルゴリズムは、(ダーウィニアンの)自然界の進化過程に触発された検索アルゴリズムの一族です…

VoAGI.com

深層ネットワークへの進化的敵対攻撃

一方で、最近の研究では、深層ニューラルネットワーク(DNN)が脆弱性を持っていることが示されています…

VoAGI.com

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

簡単なアプリの統合に最適な安定した拡散APIのトップ5

イントロダクション APIは人工知能の時代における解決策であり、AIモデルをソフトウェアやアプリケーションに統合する際の高...

データサイエンス

PandasAIの紹介:GenAIを搭載したデータ分析ライブラリ

イントロダクション 最近、ジェネレーティブ人工知能の分野で急速な発展とブレークスルーがあり、データ分野においても大きな...

機械学習

Word2Vec、GloVe、FastText、解説

コンピューターは我々と同じように単語を理解することができませんコンピューターは数字を扱うことが好きですですから、コン...

AIニュース

世界初のAI搭載アーム:知っておくべきすべて

人工知能がバイオニックアームを制御する世界を想像したことがありますか? スーパーヒーローの映画から出てきたコンセプトの...

機械学習

高度な言語モデルの世界における倫理とプライバシーの探求

はじめに 現代の急速に進化する技術的な景観において、大規模言語モデル(LLM)は、産業を再構築し、人間とコンピュータの相...

人工知能

Rows AI:エクセルスプレッドシートの終焉か?

Rows AIは、非常に複雑なデータ分析のための信じられないほどのスプレッドシートを数分で構築することができます