なぜ特徴スケーリングは機械学習において重要なのか?6つの特徴スケーリング技術についての議論

特徴スケーリングの重要性と6つの技術についての議論

標準化、正規化、ロバストスケーリング、平均正規化、最大絶対スケーリング、およびベクトルの単位長さのスケーリング

Photo by Mediamodifier on Unsplash

多くの機械学習アルゴリズムは、同じスケールで特徴を持つ必要があります。

さまざまなシナリオで選択できるさまざまな特徴スケーリング方法があります。これらには異なる(技術的な)名前があります。用語「特徴スケーリング」は、単にこれらの方法のいずれかを指します。

トピック------1. 異なるシナリオでの特徴スケーリング   a. PCA(主成分分析)における特徴スケーリング   b. k-meansにおける特徴スケーリング   c. KNNおよびSVMにおける特徴スケーリング   d. 線形モデルにおける特徴スケーリング   e. ニューラルネットワークにおける特徴スケーリング   f. 収束における特徴スケーリング   g. ツリーベースのアルゴリズムにおける特徴スケーリング   h. LDAにおける特徴スケーリング2. 特徴スケーリングの方法   a. 標準化   b. 最小-最大スケーリング(正規化)   c. ロバストスケーリング   d. 平均正規化   e. 最大絶対スケーリング   f. ベクトルの単位長さのスケーリング3. 特徴スケーリングとデータの分布4. 特徴スケーリング時のデータ漏洩5. 特徴スケーリング方法のまとめ

異なるシナリオでの特徴スケーリング

  • PCAにおける特徴スケーリング: 主成分分析では、PCAの成分は元の特徴の相対的な範囲に非常に敏感です。もし特徴が同じスケールで測定されていない場合、PCAはデータの分散を最大化する成分を選択しようとします。もしいくつかの特徴の範囲がより大きい場合、それらの特徴がPCAプロセスを支配する可能性があります。この場合、真の分散は成分によって捉えられないかもしれません。これを避けるためには、通常PCAの前に特徴スケーリングを行います。ただし、2つの例外があります。もし特徴間のスケールに有意差がない場合、例えば1つの特徴が0から1の範囲にあり、もう1つの特徴が0から1.2の範囲にある場合、特徴スケーリングは必要ありませんが、行っても問題ありません!相関行列を分解してPCAを実行する場合、特徴が同じスケールで測定されていなくても特徴スケーリングは必要ありません…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI研究

「医療分野における生成型AI」

はじめに 生成型人工知能は、ここ数年で急速に注目を集めています。医療と生成型人工知能の間に強い関係性が生まれていること...

AIニュース

「AIによるPaytmによるインド経済の保護:金融セキュリティの革新」

インドの金融セクターの景観を再定義する画期的な動きとして、Paytmという有名ブランドの親会社であるOne 97 Communications ...

AI研究

希望、恐怖、そしてAI:AIツールに対する消費者の態度に関する最新の調査結果

米国の消費者が人工知能(AI)に関する意見と認識について述べた最新の「Trust Survey」の結果を明らかにしたThe Vergeの報告...

人工知能

150以上のミッドジャーニーロゴのプロンプト

「Midjourneyのような生成AIツールを使って、ビジネスのために美しいロゴを作成することができます」

機械学習

このAIペーパーは、東京大学で深層学習を超新星シミュレーションの問題に応用しました

東京大学の研究者チームは、3D-Memory In Memory (3D-MIM) と呼ばれる深層学習モデルを開発しました。このモデルは、超新星(S...

データサイエンス

グラフニューラルネットワークによるローマ数字の分析

『この記事では、自動和声分析のモデル開発の過程を説明したいと思います個人的には音楽を深く理解することに興味があります...