なぜ特徴スケーリングは機械学習において重要なのか?6つの特徴スケーリング技術についての議論

特徴スケーリングの重要性と6つの技術についての議論

標準化、正規化、ロバストスケーリング、平均正規化、最大絶対スケーリング、およびベクトルの単位長さのスケーリング

Photo by Mediamodifier on Unsplash

多くの機械学習アルゴリズムは、同じスケールで特徴を持つ必要があります。

さまざまなシナリオで選択できるさまざまな特徴スケーリング方法があります。これらには異なる(技術的な)名前があります。用語「特徴スケーリング」は、単にこれらの方法のいずれかを指します。

トピック------1. 異なるシナリオでの特徴スケーリング   a. PCA(主成分分析)における特徴スケーリング   b. k-meansにおける特徴スケーリング   c. KNNおよびSVMにおける特徴スケーリング   d. 線形モデルにおける特徴スケーリング   e. ニューラルネットワークにおける特徴スケーリング   f. 収束における特徴スケーリング   g. ツリーベースのアルゴリズムにおける特徴スケーリング   h. LDAにおける特徴スケーリング2. 特徴スケーリングの方法   a. 標準化   b. 最小-最大スケーリング(正規化)   c. ロバストスケーリング   d. 平均正規化   e. 最大絶対スケーリング   f. ベクトルの単位長さのスケーリング3. 特徴スケーリングとデータの分布4. 特徴スケーリング時のデータ漏洩5. 特徴スケーリング方法のまとめ

異なるシナリオでの特徴スケーリング

  • PCAにおける特徴スケーリング: 主成分分析では、PCAの成分は元の特徴の相対的な範囲に非常に敏感です。もし特徴が同じスケールで測定されていない場合、PCAはデータの分散を最大化する成分を選択しようとします。もしいくつかの特徴の範囲がより大きい場合、それらの特徴がPCAプロセスを支配する可能性があります。この場合、真の分散は成分によって捉えられないかもしれません。これを避けるためには、通常PCAの前に特徴スケーリングを行います。ただし、2つの例外があります。もし特徴間のスケールに有意差がない場合、例えば1つの特徴が0から1の範囲にあり、もう1つの特徴が0から1.2の範囲にある場合、特徴スケーリングは必要ありませんが、行っても問題ありません!相関行列を分解してPCAを実行する場合、特徴が同じスケールで測定されていなくても特徴スケーリングは必要ありません…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

中間旅程のタトゥープロンプト

次のタトゥーのインスピレーションを探している場合は、Midjourneyを使用してみてください

AI研究

『このAI研究は、IFPおよびリポソーム蓄積を予測するための物理ベースの深層学習を発表します』

がん治療の精緻化を追求する中、研究者たちは、腫瘍のダイナミクスを飛躍的に向上させる画期的な解決策を導入しました。この...

機械学習

「ディープラーニングモデルのレイヤーを凍結する方法 - 正しいやり方」

「モデルの微調整を行いたい場合や、処理する例に応じて一部のパラメータを固定することは、しばしば有用です以下の例で示さ...

AIニュース

人工知能によって設計された薬剤が、人間の試験のために準備ができました

中国の複合企業フォン・グループとプライベートエクイティ企業ウォルバーグ・ピンカスに支援されたバイオテック企業Insilico ...

機械学習

ハリウッドにおけるディズニーの論争:AIが登場し、脚本家と俳優が退場!

ハリウッドの中心地で、AIは分かれる存在になっています。映画業界の創造的本質を守るディズニーの脚本家や俳優たちは、AIが...

データサイエンス

「LangchainなしでPDFチャットボットを構築する方法」

はじめに Chatgptのリリース以来、AI領域では進歩のペースが減速する気配はありません。毎日新しいツールや技術が開発されて...