「MLの学習に勇気を持つ:L1&L2正則化の解明(パート2)」

「MLの学習に勇気を持つ:L1&L2正則化の解明(パート2)をサイエンスする」

ラグランジュ乗数とL1スパース性背後の直感を解き放つ

「勇気を学ぶML:L1&L2正則化の解明」パート2へお帰りください。以前のディスカッションで、重みの罰則化技術を介してより小さい係数の利点とその手法について探求しました。今回は、この続編で私たちのメンターと学習者がL1およびL2正則化の領域にさらに深く踏み込みます。

次のような質問を悩んでいる方々にぴったりな場所にいます:

  • L1およびL2正則化の名称の理由は何ですか?
  • 古典的なL1およびL2正則化グラフをどのように解釈しますか?
  • ラグランジュ乗数とは何であり、直感的に理解する方法はありますか?
  • L1スパース性を理解するためにラグランジュ乗数を適用する方法。

あなたの関与(いいね、コメント、フォロー)は士気を高めるだけでなく、私たちの発見の旅を支えるのです!では、さっそく探求してみましょう。

写真:Aarón Blanco Tejedor氏 - Unsplash

なぜL1、L2正則化と呼ぶのでしょうか?

L1正則化およびL2正則化という名前は、Lpノルムの概念から直接派生しています。Lpノルムは、空間内の原点から点までの距離を計算するさまざまな方法を表します。たとえば、L1ノルムはマンハッタン距離としても知られており、∣x∣+∣y∣のように座標の絶対値を使用して距離を計算します。一方、L2ノルムまたはユークリッド距離は、x² + y²)の平方根として計算されます。

機械学習における正則化の文脈では、これらのノルムは損失関数に追加されるペナルティ項を作成するために使用されます。Lp正則化は、高次元空間でモデルの重みが原点からの総距離を測定すると考えることができます。ノルムの選択は、このペナルティの性質に影響を与えます:L1ノルムはいくつかの係数をゼロにする傾向があり、実質的により重要な特徴を選択します。一方、L2ノルムは係数をゼロに近づけ、個々の特徴がモデルに不釣り合いな影響を与えないようにします。

したがって、L1およびL2正則化はこれらの数学的ノルムで名付けられています—L1ノルムおよびL2ノルム—…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more