特徴変換:PCAとLDAのチュートリアル

特徴変換のチュートリアル:PCAとLDA

PCAを使用したデータセットの次元削減

写真:Nicole Cagnina氏撮影、Unsplashより

イントロダクション

高次元データを扱う際には、Principal Component Analysis (PCA)などの手法を使用してデータの次元を削減することが一般的です。これにより、データは異なる(低次元)の特徴セットに変換されます。これは、元の特徴のサブセットを選択する特徴選択とは対照的です(特徴選択のチュートリアルについては[1]を参照)。

PCAはデータを低次元空間に対して線形変換します。この記事では、まず線形変換とは何かを説明し、次にPythonの例を使用してPCAの動作を示します。記事の最後には、教師あり線形変換法であるLinear Discriminant Analysis(LDA)の説明があります。この論文で紹介された手法のPythonコードはGitHubで入手できます。

線形変換

例えば、休暇後にBillがMaryに£5と$15の借金があり、それをユーロ(€)で支払わなければなりません。為替レートは、£1 = €1.15および$1 = €0.93です。したがって、€での借金額は次のようになります:

ここでは、借金を2次元(£、$)から1次元(€)に変換しています。このうち3つの例を図1に示します。オリジナルの借金(£5、$15)と他の2つの借金(£15、$20)および(£20、$35)です。緑の点はオリジナルの借金で、赤の点は1次元に射影された借金です。赤い線はこの新しい次元を表します。

図1。£、$の借金を€に変換する方法のイラスト。著者による画像。

図の左側では、これを行列の乗算として表現する方法が示されています。オリジナルのデータセットは3行2列の行列(3つのサンプル、2つの特徴)であり、為替レートは2つの要素からなる1次元の行列であり、出力は3つの要素からなる1次元の行列です。為替レート行列は変換です。為替レートが変更されると、変換も変更されます。

以下のPythonコードを使用して、この行列の乗算を実行できます。行列はnumpy配列として表されます。最後の行は、行列の乗算(内積)を実行するためにcur行列にdotメソッドを呼び出しています。これ…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

アーティスの創設者兼CEO、ウィリアム・ウーによるインタビューシリーズ

ウィリアム・ウーは、Artisseの創設者兼CEOであり、ユーザーの好みに基づいて写真を精密に変更する技術を提供していますそれ...

人工知能

『ジュリエット・パウエル&アート・クライナー、The AI Dilemma – インタビューシリーズの著者』

『AIのジレンマ』は、ジュリエット・パウエルとアート・クライナーによって書かれましたジュリエット・パウエルは、著者であ...

データサイエンス

「Seerの最高データオフィサーであるDr. Serafim Batzoglouによるインタビューシリーズ」

セラフィム・バツォグルはSeerのチーフデータオフィサーですSeerに加わる前は、セラフィムはInsitroのチーフデータオフィサー...

人工知能

ファイデムのチーフ・プロダクト・オフィサー、アルパー・テキン-インタビューシリーズ

アルパー・テキンは、FindemというAI人材の獲得と管理プラットフォームの最高製品責任者(CPO)ですFindemのTalent Data Clou...

人工知能

ディープAIの共同創業者兼CEO、ケビン・バラゴナ氏- インタビューシリーズ

ディープAIの創設者であるケビン・バラゴナは、10年以上の経験を持つプロのソフトウェアエンジニア兼製品開発者です彼の目標...

データサイエンス

2023年にAmazonのデータサイエンティストになる方法は?

ほとんどのビジネスは現在、膨大な量のデータを生成し、編集し、管理しています。しかし、ほとんどのビジネスは、収集したデ...