pca降维的理论知识( 三 )


旋转变换是正交变换的一个方面,这个挺有用的,比如在开发中需要实现某种旋转效果,直接可以用旋转变换实现 。正交变换的另一个方面是反射变换,也即e1'的方向与图中方向相反,这个不再讨论 。
总结:正交矩阵的行(列)向量都是两两正交的单位向量,正交矩阵对应的变换为正交变换,它有两种表现:旋转和反射 。正交矩阵将标准正交基映射为标准正交基(即图中从e1、e2到e1'、e2')
特征值分解——EVD
在讨论SVD之前先讨论矩阵的特征值分解(EVD),在这里,选择一种特殊的矩阵——对称阵(酉空间中叫矩阵即厄米阵) 。对称阵有一个很优美的性质:它总能相似对角化,对称阵不同特征值对应的特征向量两两正交 。一个矩阵能相似对角化即说明其特征子空间即为其列空间,若不能对角化则其特征子空间为列空间的子空间 。现在假设存在mxm的满秩对称矩阵A,它有m个不同的特征值,设特征值为
(转)" />
对应的单位特征向量为
(转)" />
则有

pca降维的理论知识

文章插图

pca降维的理论知识

文章插图
(转)" />
进而
(转)" />
(转)" />
pca降维的理论知识

文章插图
(转)" />
所以可得到A的特征值分解(由于对称阵特征向量两两正交,所以U为正交阵,正交阵的逆矩阵等于其转置)
(转)" />
这里假设A有m个不同的特征值,实际上,只要A是对称阵其均有如上分解 。
矩阵A分解了,相应的,其对应的映射也分解为三个映射 。现在假设有x向量,用A将其变换到A的列空间中,那么首先由U'先对x做变换:
(转)" />
U是正交阵U'也是正交阵,所以U'对x的变换是正交变换,它将x用新的坐标系来表示,这个坐标系就是A的所有正交的特征向量构成的坐标系 。比如将x用A的所有特征向量表示为:
(转)" />
则通过第一个变换就可以把x表示为[a1 a2 ... am]':
pca降维的理论知识

文章插图
(转)" />
紧接着,在新的坐标系表示下,由中间那个对角矩阵对新的向量坐标换,其结果就是将向量往各个轴方向拉伸或压缩:
pca降维的理论知识

文章插图
(转)" />
从上图可以看到,如果A不是满秩的话,那么就是说对角阵的对角线上元素存在0,这时候就会导致维度退化,这样就会使映射后的向量落入m维空间的子空间中 。
最后一个变换就是U对拉伸或压缩后的向量做变换,由于U和U'是互为逆矩阵,所以U变换是U'变换的逆变换 。
因此,从对称阵的分解对应的映射分解来分析一个矩阵的变换特点是非常直观的 。假设对称阵特征值全为1那么显然它就是单位阵,如果对称阵的特征值有个别是0其他全是1,那么它就是一个正交投影矩阵,它将m维向量投影到它的列空间中 。
根据对称阵A的特征向量,如果A是2*2的,那么就可以在二维平面中找到这样一个矩形,是的这个矩形经过A变换后还是矩形:
pca降维的理论知识

文章插图
(转)" />
这个矩形的选择就是让其边都落在A的特征向量方向上,如果选择其他矩形的话变换后的图形就不是矩形了!
奇异值分解——SVD
上面的特征值分解的A矩阵是对称阵,根据EVD可以找到一个(超)矩形使得变换后还是(超)矩形,也即A可以将一组正交基映射到另一组正交基!那么现在来分析:对任意M*N的矩阵,能否找到一组正交基使得经过它变换后还是正交基?答案是肯定的,它就是SVD分解的精髓所在 。