なぜ特徴スケーリングは機械学習において重要なのか?6つの特徴スケーリング技術についての議論

特徴スケーリングの重要性と6つの技術についての議論

標準化、正規化、ロバストスケーリング、平均正規化、最大絶対スケーリング、およびベクトルの単位長さのスケーリング

Photo by Mediamodifier on Unsplash

多くの機械学習アルゴリズムは、同じスケールで特徴を持つ必要があります。

さまざまなシナリオで選択できるさまざまな特徴スケーリング方法があります。これらには異なる(技術的な)名前があります。用語「特徴スケーリング」は、単にこれらの方法のいずれかを指します。

トピック------1. 異なるシナリオでの特徴スケーリング   a. PCA(主成分分析)における特徴スケーリング   b. k-meansにおける特徴スケーリング   c. KNNおよびSVMにおける特徴スケーリング   d. 線形モデルにおける特徴スケーリング   e. ニューラルネットワークにおける特徴スケーリング   f. 収束における特徴スケーリング   g. ツリーベースのアルゴリズムにおける特徴スケーリング   h. LDAにおける特徴スケーリング2. 特徴スケーリングの方法   a. 標準化   b. 最小-最大スケーリング(正規化)   c. ロバストスケーリング   d. 平均正規化   e. 最大絶対スケーリング   f. ベクトルの単位長さのスケーリング3. 特徴スケーリングとデータの分布4. 特徴スケーリング時のデータ漏洩5. 特徴スケーリング方法のまとめ

異なるシナリオでの特徴スケーリング

  • PCAにおける特徴スケーリング: 主成分分析では、PCAの成分は元の特徴の相対的な範囲に非常に敏感です。もし特徴が同じスケールで測定されていない場合、PCAはデータの分散を最大化する成分を選択しようとします。もしいくつかの特徴の範囲がより大きい場合、それらの特徴がPCAプロセスを支配する可能性があります。この場合、真の分散は成分によって捉えられないかもしれません。これを避けるためには、通常PCAの前に特徴スケーリングを行います。ただし、2つの例外があります。もし特徴間のスケールに有意差がない場合、例えば1つの特徴が0から1の範囲にあり、もう1つの特徴が0から1.2の範囲にある場合、特徴スケーリングは必要ありませんが、行っても問題ありません!相関行列を分解してPCAを実行する場合、特徴が同じスケールで測定されていなくても特徴スケーリングは必要ありません…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

データサイエンス

AIのオリンピック:機械学習システムのベンチマーク

何年もの間、4分以内で1マイルを走ることは、単なる困難な課題ではなく、多くの人にとっては不可能な偉業と考えられていまし...

データサイエンス

このAI研究は、近くの電話によって記録されたキーストロークを聞くことで、95%の正確さでデータを盗むことができるディープラーニングモデルを紹介しています

ディープラーニングの進歩とマイクロフォンの普及に伴い、個人デバイスを通じたオンラインサービスの人気が高まる中、キーボ...

機械学習

Google AIは、アクティブノイズキャンセリング(ANC)ヘッドフォンのための人工知能搭載の革新的な心臓モニタリングモダリティである音響脈波計(APG)を導入します

コンシューマーエレクトロニクスと健康技術の分野において、活発なノイズキャンセリング(ANC)ウェアラブルに健康モニタリン...

機械学習

「FlexGenに会おう:GPUメモリが限られている場合に大規模な言語モデル(LLM)を実行するための高スループットな生成エンジン」

大規模言語モデル(LLM)は最近、さまざまなタスクで印象的なパフォーマンスを発揮しています。生成型LLMの推論は以前にない...

データサイエンス

「メタは、トレーニングにLLaMAモデルを使用するために著作権のある本を使用し、著者たちは訴訟を起こしています」

Meta Platforms、以前のFacebookとして知られる企業が、コメディアンのサラ・シルバーマンやピュリッツァー賞受賞者のマイケ...

機械学習

「ステーブル拡散」は実際にどのように機能するのでしょうか?直感的な説明

この短い記事では、初心者に対して安定した拡散(Stable Diffusion)が直感的にどのように機能するかを説明していますこれは...