主成分分析の確率的な視点

主成分分析の確率的な視点

潜在変数、期待値最大化、および変分推論

Hidden Variablesを探す(写真のクレジット:著者)

データサイエンスと機械学習で主に使用される次元削減技術の一つは、主成分分析(PCA)です。以前、PCAをサポートベクトルマシンとのパイプラインで適用するいくつかの例についてすでに説明しましたが、ここではPCAの確率的な視点を見て、基礎となるデータ構造のより堅牢で包括的な理解を提供します。確率的なPCA(PPCA)の最大の利点の一つは、クラシカルなPCAでは不可能なデータセット内の欠損値の処理ができることです。潜在変数モデルと期待値最大化アルゴリズムについて議論するため、この詳細な記事も参照してください。

この記事から得られる情報は以下の通りです:

  1. PCAの短い紹介。
  2. PPCAの数学的な基礎。
  3. 期待値最大化(EM)アルゴリズムまたは変分推論?パラメータ推定にはどちらを使用するべきか。
  4. おもちゃのデータセットに対してTensorFlow Probabilityを使用してPPCAを実装する方法。

さあ、これについて深く掘り下げましょう!

1. 特異値分解(SVD)とPCA:

線形代数の主要な重要概念の一つはSVDであり、それは実数または複素行列のための因数分解技術です。例えば、行列Aを以下のように因数分解できます:

ここで、U、Vᵀは直交行列(転置は逆行列に等しい)であり、Σは対角行列です。Aは正方行列である必要はありません。例えば、N×D行列と考えることができます。ここで、Nはインスタンスの数、Dは特徴量の数です。UとVはそれぞれ正方行列(N×N)および(D×D)であり、ΣはN×D行列であり、D×Dの部分は対角線であり、残りの要素はゼロです。

また、固有値分解も知られています。対角化可能な正方行列(B)は以下のように因数分解できます:

ここで、Qは行列Bの第i列が固有ベクトルq_iであるN×Nの正方行列であり、Λは対角行列であり、対角要素は対応する固有値です。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

「UVeyeの共同設立者兼CEO、アミール・ヘヴェルについてのインタビューシリーズ」

アミール・ヘヴァーは、UVeyeのCEO兼共同創設者であり、高速かつ正確な異常検出により、自動車およびセキュリティ産業に直面...

データサイエンス

2023年にAmazonのデータサイエンティストになる方法は?

ほとんどのビジネスは現在、膨大な量のデータを生成し、編集し、管理しています。しかし、ほとんどのビジネスは、収集したデ...

人工知能

ピーター・マッキー、Sonarの開発者担当責任者-インタビューシリーズ

ピーター・マッキーはSonarのDeveloper Relationsの責任者です Sonarは、悪いコードの1兆ドルの課題を解決するプラットフォー...

AIニュース

Q&A:ブラジルの政治、アマゾンの人権、AIについてのGabriela Sá Pessoaの見解

ブラジルの社会正義のジャーナリストは、MIT国際研究センターのフェローです

AIテクノロジー

アンソニー・グーネティレケ氏は、Amdocsのグループ社長であり、テクノロジー部門および戦略部門の責任者です- インタビューシリーズ

アンソニー・グーネティレーケは、Amdocsでグループ社長、テクノロジーと戦略担当です彼と企業戦略チームは、会社の戦略を策...

人工知能

ムーバブルインクのCEO兼共同創設者であるヴィヴェク・シャルマ氏についてのインタビュー・シリーズ

ビヴェクは2010年にムーバブルインクを共同設立し、急速な成長を遂げながら、600人以上の従業員を擁し、世界有数の革新的なブ...