我可以使用主成分分析将我的数据减少到一个维度吗?



我有一个包含10个变量的数据集,我希望将其减少到单个"分数"。我了解PCA的基础知识,它使用变量的协方差矩阵来创建10个特征向量和10个特征值。通常我们要做的是将特征向量乘以归一化数据来生成主成分,他们选择任意数量的主成分,然后把它们投入到回归中,得到拟合值。换句话说,系数乘以主成分允许将数据简化为单个变量。

我的问题是我是否需要做回归步骤(我没有因变量)。不做回归,我可以用特征值作为系数吗?换句话说,我能否取特征值向量和主成分的内积来产生一个单一的变量?

我从未见过这样使用它(据我所知甚至没有人问过这个问题),但对我来说这似乎是直觉。是我遗漏了什么,还是这是合法的,只是我没有找对地方?谢谢!

是否有目标变量?因为这里有两个东西

  1. 主成分回归与
  2. 主成分分析

如果您有一个目标变量(您想要预测或解释的变量),如果不是第二个,则回归。PC回归—>您需要一个目标变量

PC分析->你不需要任何回归步骤。

我认为你是第二种情况。所以你只是想把你的10个变量减少到1个来总结一切。

也许是一个有趣的Python教程:https://jakevdp.github.io/PythonDataScienceHandbook/05.09-principal-component-analysis.html

相关内容

最新更新