在 R 中对数据集应用 PCA 后,减小数据集的维度



我的问题是如何使用使用R获得的主成分。

一旦你得到了主成分,我们如何使用它来减少维度?我有一个包含 6 个变量的data_set,我需要使用 k 均值对其进行聚类。当我对 6 个变量进行聚类时,K 均值给了我一个散点图。我认为 pca 可以帮助减小尺寸,因此 k-means 可以产生丰硕的成果。

我这样做是为了获得主要组件:

pca1 <- prcomp(data_set)

请指导我如何进一步降低数据集的维度。

如果你键入例如?prcomp,你可以找到从函数中获得的值这是我过去使用另一个包所做的:

library("FactoMineR")
pca <- PCA(dataset, scale.unit=TRUE, graph=FALSE)
scores <- data.frame(pca$ind$coord)
library(ggplot2)
ggplot(scores,aes(Dim.1,Dim.2)) + geom_text(label=rownames(scores),colour="red") + geom_hline(yintercept=0) + geom_vline(xintercept=0) + labs(title="Score plot")

您可以根据 PC1 和 PC2 获得分数图,如果您想要载荷图,则相同

loadings <- data.frame(pca$var$coord)

最新更新