无监督学习—

无监督学习——降维

降维算法应用：数据压缩、数据可视化。

主成分分析(PCA)是最常见的降维算法。

在 PCA 中，我们要做的是找到一个方向向量（Vector direction），当我们把所有的数据

都投射到该向量上时，我们希望投射平均均方误差能尽可能地小。方向向量是一个经过原点

的向量，而投射误差是从特征向量向该方向向量作垂线的长度。

PCA算法推导

关于PCA算法推导我觉得还是挺复杂的。之前在做数模比赛时，经常用到PCA算法，但是都是拿来直接套用解决实际问题，根本没有仔细思考原理推导。

这里总结一下PCA算法原理推导中用到的两个重要原理：

特征值分解矩阵和SVD分解矩阵。

1. 特征值分解矩阵原理

(1) 特征值与特征向量

如果一个向量v是矩阵A的特征向量，将一定可以表示成下面的形式：

$Av=lambda v$

其中，λ是特征向量v对应的特征值，一个矩阵的一组特征向量是一组正交向量。

(2) 特征值分解矩阵

对于矩阵A，有一组特征向量v，将这组向量进行正交化单位化，就能得到一组正交单位向量。特征值分解，就是将矩阵A分解为如下式：

$A=QSigma Q^{-1}$

其中，Q是矩阵A的特征向量组成的矩阵， $Sigma$ 则是一个对角阵，对角线上的元素就是特征值。

2. SVD分解矩阵原理

奇异值分解是一个能适用于任意矩阵的一种分解的方法，对于任意矩阵A总是存在一个奇异值分解：

$A=USigma V^{T}$

假设A是一个m*n的矩阵，那么得到的U是一个m*m的方阵，U里面的正交向量被称为左奇异向量。Σ是一个m*n的矩阵，Σ除了对角线其它元素都为0，对角线上的元素称为奇异值。 $V^{T}$ 是v的转置矩阵，是一个n*n的矩阵，它里面的正交向量被称为右奇异值向量。而且一般来讲，我们会将Σ上的值按从大到小的顺序排列。