主成分分析为什么我们要找到向量的最大值



我试图理解PCA,但我被困在一个特定的部分。在哈佛数据科学课程中被引用后,我在这里查找了一下:https://en.wikipedia.org/wiki/Principal_component_analysis在细节下面,然后在第一个组件下面,他们说"第一个加载向量w(1)因此必须满足",我理解为什么下面一行是真的?

当||w|| = 1时,arg max意味着当w是单位向量时,我们找到了求和的最大值。但我不明白我们为什么要这样做,或者如果我们有一个给定的矩阵x,这些值是如何变化的,除非我们试图优化每一行的权重点乘?

或者我们只是这样做,把它变成罗利商形式,这样我们就可以用特征值找到与矩阵相关的最大特征向量?(这也是最大的向量)

,为什么我们首先需要最大的向量?在变换后的坐标轴上我们是否只显示了每个维度上最大的方差?难道我们不想把所有的点都变换一下,然后试着找出一些相关性吗?

在某种意义上,特征值最大的特征向量指向方差最大的方向。第二大特征值指向最大方差的方向,这是在考虑第一个特征值后剩下的。具有第二大特征值的特征向量将与具有最大特征值的特征向量正交。再看一下您引用的维基百科文章,并查找右上方的图表。较长的线是具有最大特征值的特征向量,它指向数据中的最大方差。较短的线是具有第二大特征值的特征向量,它指向最大剩余方差,与第一行正交。

相关内容

  • 没有找到相关文章

最新更新