特徴変換:PCAとLDAのチュートリアル

特徴変換のチュートリアル:PCAとLDA

PCAを使用したデータセットの次元削減

写真:Nicole Cagnina氏撮影、Unsplashより

イントロダクション

高次元データを扱う際には、Principal Component Analysis (PCA)などの手法を使用してデータの次元を削減することが一般的です。これにより、データは異なる(低次元)の特徴セットに変換されます。これは、元の特徴のサブセットを選択する特徴選択とは対照的です(特徴選択のチュートリアルについては[1]を参照)。

PCAはデータを低次元空間に対して線形変換します。この記事では、まず線形変換とは何かを説明し、次にPythonの例を使用してPCAの動作を示します。記事の最後には、教師あり線形変換法であるLinear Discriminant Analysis(LDA)の説明があります。この論文で紹介された手法のPythonコードはGitHubで入手できます。

線形変換

例えば、休暇後にBillがMaryに£5と$15の借金があり、それをユーロ(€)で支払わなければなりません。為替レートは、£1 = €1.15および$1 = €0.93です。したがって、€での借金額は次のようになります:

ここでは、借金を2次元(£、$)から1次元(€)に変換しています。このうち3つの例を図1に示します。オリジナルの借金(£5、$15)と他の2つの借金(£15、$20)および(£20、$35)です。緑の点はオリジナルの借金で、赤の点は1次元に射影された借金です。赤い線はこの新しい次元を表します。

図1。£、$の借金を€に変換する方法のイラスト。著者による画像。

図の左側では、これを行列の乗算として表現する方法が示されています。オリジナルのデータセットは3行2列の行列(3つのサンプル、2つの特徴)であり、為替レートは2つの要素からなる1次元の行列であり、出力は3つの要素からなる1次元の行列です。為替レート行列は変換です。為替レートが変更されると、変換も変更されます。

以下のPythonコードを使用して、この行列の乗算を実行できます。行列はnumpy配列として表されます。最後の行は、行列の乗算(内積)を実行するためにcur行列にdotメソッドを呼び出しています。これ…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

「コマンドバーの創設者兼CEO、ジェームズ・エバンスによるインタビューシリーズ」

ジェームズ・エバンズは、CommandBarの創設者兼CEOであり、製品、マーケティング、顧客チームを支援するために設計されたAIパ...

人工知能

「マーク・A・レムリー教授による生成AIと法律について」

データサイエンス内で新しい分野が現れ、研究内容が理解しにくい場合は、専門家やパイオニアと話すことが最善です最近、私た...

人工知能

「Ami Hever、UVeyeの共同創設者兼CEO - インタビューシリーズ」

עמיר חבר הוא המנכל והמייסד של UVeye, סטארט-אפ ראיה ממוחשבת בלמידה עמוקה, המציבה את התקן הגלובלי לבדיקת רכבים עם זיהוי...

機械学習

「Prolificの機械学習エンジニア兼AIコンサルタント、ノラ・ペトロヴァ – インタビューシリーズ」

『Nora Petrovaは、Prolificの機械学習エンジニア兼AIコンサルタントですProlificは2014年に設立され、既にGoogle、スタンフ...

データサイエンス

「Seerの最高データオフィサーであるDr. Serafim Batzoglouによるインタビューシリーズ」

セラフィム・バツォグルはSeerのチーフデータオフィサーですSeerに加わる前は、セラフィムはInsitroのチーフデータオフィサー...

AIニュース

Q&A:ブラジルの政治、アマゾンの人権、AIについてのGabriela Sá Pessoaの見解

ブラジルの社会正義のジャーナリストは、MIT国際研究センターのフェローです