特徴変換:PCAとLDAのチュートリアル

特徴変換のチュートリアル:PCAとLDA

PCAを使用したデータセットの次元削減

写真:Nicole Cagnina氏撮影、Unsplashより

イントロダクション

高次元データを扱う際には、Principal Component Analysis (PCA)などの手法を使用してデータの次元を削減することが一般的です。これにより、データは異なる(低次元)の特徴セットに変換されます。これは、元の特徴のサブセットを選択する特徴選択とは対照的です(特徴選択のチュートリアルについては[1]を参照)。

PCAはデータを低次元空間に対して線形変換します。この記事では、まず線形変換とは何かを説明し、次にPythonの例を使用してPCAの動作を示します。記事の最後には、教師あり線形変換法であるLinear Discriminant Analysis(LDA)の説明があります。この論文で紹介された手法のPythonコードはGitHubで入手できます。

線形変換

例えば、休暇後にBillがMaryに£5と$15の借金があり、それをユーロ(€)で支払わなければなりません。為替レートは、£1 = €1.15および$1 = €0.93です。したがって、€での借金額は次のようになります:

ここでは、借金を2次元(£、$)から1次元(€)に変換しています。このうち3つの例を図1に示します。オリジナルの借金(£5、$15)と他の2つの借金(£15、$20)および(£20、$35)です。緑の点はオリジナルの借金で、赤の点は1次元に射影された借金です。赤い線はこの新しい次元を表します。

図1。£、$の借金を€に変換する方法のイラスト。著者による画像。

図の左側では、これを行列の乗算として表現する方法が示されています。オリジナルのデータセットは3行2列の行列(3つのサンプル、2つの特徴)であり、為替レートは2つの要素からなる1次元の行列であり、出力は3つの要素からなる1次元の行列です。為替レート行列は変換です。為替レートが変更されると、変換も変更されます。

以下のPythonコードを使用して、この行列の乗算を実行できます。行列はnumpy配列として表されます。最後の行は、行列の乗算(内積)を実行するためにcur行列にdotメソッドを呼び出しています。これ…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

「ElaiのCEO&共同創業者、Vitalii Romanchenkoについてのインタビューシリーズ」

ヴィタリー・ロマンチェンコは、ElaiのCEO兼共同創設者であり、マイク、カメラ、俳優、スタジオの必要なく、個人が一流のビデ...

人工知能

「Kognitosの創設者兼CEO、ビニー・ギル- インタビューシリーズ」

ビニー・ギルは、複数の役職と企業を横断する多様で幅広い業務経験を持っていますビニーは現在、Kognitosの創設者兼CEOであり...

人工知能

「コーネリスネットワークスのソフトウェアエンジニアリング担当副社長、ダグ・フラーラー氏 - インタビューシリーズ」

ソフトウェアエンジニアリングの副社長として、DougはCornelis Networksのソフトウェアスタック全体、Omni-Path Architecture...

人工知能

「aiOlaのCEO兼共同創設者、アミール・ハラマティによるインタビューシリーズ」

アミール・ハラマティは、aiOlaのCEO兼共同創業者であり、スピーチを作業可能にし、どこでも完全な正確さで業界固有のプロセ...

データサイエンス

「2023年にデータサイエンスFAANGの仕事をゲットする方法は?」

データサイエンスは非常に求められる分野となり、FAANG(Facebook、Amazon、Apple、Netflix、Google)企業での就職は大きな成...

データサイエンス

アステラソフトウェアのCOO、ジェイ・ミシュラ - インタビューシリーズ

ジェイ・ミシュラは、急速に成長しているエンタープライズ向けデータソリューションの提供企業であるAstera Softwareの最高執...