特徴変換:PCAとLDAのチュートリアル

特徴変換のチュートリアル:PCAとLDA

PCAを使用したデータセットの次元削減

写真:Nicole Cagnina氏撮影、Unsplashより

イントロダクション

高次元データを扱う際には、Principal Component Analysis (PCA)などの手法を使用してデータの次元を削減することが一般的です。これにより、データは異なる(低次元)の特徴セットに変換されます。これは、元の特徴のサブセットを選択する特徴選択とは対照的です(特徴選択のチュートリアルについては[1]を参照)。

PCAはデータを低次元空間に対して線形変換します。この記事では、まず線形変換とは何かを説明し、次にPythonの例を使用してPCAの動作を示します。記事の最後には、教師あり線形変換法であるLinear Discriminant Analysis(LDA)の説明があります。この論文で紹介された手法のPythonコードはGitHubで入手できます。

線形変換

例えば、休暇後にBillがMaryに£5と$15の借金があり、それをユーロ(€)で支払わなければなりません。為替レートは、£1 = €1.15および$1 = €0.93です。したがって、€での借金額は次のようになります:

ここでは、借金を2次元(£、$)から1次元(€)に変換しています。このうち3つの例を図1に示します。オリジナルの借金(£5、$15)と他の2つの借金(£15、$20)および(£20、$35)です。緑の点はオリジナルの借金で、赤の点は1次元に射影された借金です。赤い線はこの新しい次元を表します。

図1。£、$の借金を€に変換する方法のイラスト。著者による画像。

図の左側では、これを行列の乗算として表現する方法が示されています。オリジナルのデータセットは3行2列の行列(3つのサンプル、2つの特徴)であり、為替レートは2つの要素からなる1次元の行列であり、出力は3つの要素からなる1次元の行列です。為替レート行列は変換です。為替レートが変更されると、変換も変更されます。

以下のPythonコードを使用して、この行列の乗算を実行できます。行列はnumpy配列として表されます。最後の行は、行列の乗算(内積)を実行するためにcur行列にdotメソッドを呼び出しています。これ…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

「パクストンAIの共同創業者兼CEO、タングイ・シャウ - インタビューシリーズ」

タングイ・ショウは、Paxton AIの共同創設者兼CEOであり、法的研究と起草の負担を軽減するためにGenerative AIを使用するプラ...

データサイエンス

2023年にAmazonのデータサイエンティストになる方法は?

ほとんどのビジネスは現在、膨大な量のデータを生成し、編集し、管理しています。しかし、ほとんどのビジネスは、収集したデ...

AIテクノロジー

「LXTのテクノロジーバイスプレジデント、アムル・ヌール・エルディン - インタビューシリーズ」

アムル・ヌール・エルディンは、LXTのテクノロジー担当副社長ですアムルは、自動音声認識(ASR)の文脈での音声/音響処理と機...

データサイエンス

「David Smith、TheVentureCityの最高データオフィサー- インタビューシリーズ」

デビッド・スミス(別名「デビッド・データ」)は、TheVentureCityのチーフデータオフィサーであり、ソフトウェア駆動型のス...

人工知能

ジョナサン・ダムブロット、Cranium AIのCEO兼共同創設者- インタビューシリーズ

ジョナサン・ダムブロットは、Cranium AIのCEO兼共同創業者ですCranium AIは、サイバーセキュリティおよびデータサイエンスチ...

機械学習

3つの質問:大規模言語モデルについて、Jacob Andreasに聞く

CSAILの科学者は、最新の機械学習モデルを通じた自然言語処理の研究と、言語が他の種類の人工知能をどのように高めるかの調査...