在韦卡做PCA

我正在尝试在WEKA（分类问题）中进行PCA降维。

我的数据中有 200 个

属性和接近 2100 行。

以下是我遵循的步骤

在WEKA资源管理器中导入csv文件
"预处理"选项卡中，应用，规范化数据（使整个数据在 [0，1] 范围内
然后实施 PCA。
- 在 PCA 的选项中，有一个 centerData 选项，如果设置为 False，将在标准化数据后使用相关矩阵进行计算（如果我错了，请纠正我），如果设置为 true，将使用协方差矩阵。

我的疑问是

在

这两种情况下，我应该在PCA WEKA中为中心数据选项选择什么选项？

这个问题在这里得到了部分回答：首先是PCA还是首先规范化？

要直接回答您的问题：

规范化将是个人选择。如果设置 centerData=TRUE，并且不规范化或标准化数据，则某些具有较大值的属性在 PCA 中的影响将更大。如果您设置 centerData=FALSE，Weka 会为您标准化数据。

为了证实您的怀疑，在Weka中，centerData执行以下操作：

中心数据=真

中心数据=假

相关内容