2017年法国有3个量化变量(公共意识形态、政党意识形态、政府意识形态(。X、 Y,Z。我可以用Rstudio计算Pearson相关性并得到一个表示三个变量相关性的值吗?
您可以使用主成分来确定所有变量的最大协方差。第一个分量和解释的方差量测量它们的联合协方差。举个例子,这里是R附带的虹膜数据集。它有四个度量测量,但过程是相同的:
data(iris)
iris.pca <- prcomp(iris[, 1:4], scale.=TRUE)
summary(iris.pca)
# Importance of components:
# PC1 PC2 PC3 PC4
# Standard deviation 1.7084 0.9560 0.38309 0.14393
# Proportion of Variance 0.7296 0.2285 0.03669 0.00518
# Cumulative Proportion 0.7296 0.9581 0.99482 1.00000
第一个分量解释了四个变量之间72.96%的协方差。如果变量测量的是不同的事物或在不同的尺度上,那么使用scale.=TRUE
是很重要的。它在分析之前将变量转换为Z分数,因此每个变量占总方差的1/k,其中k是变量的数量。
根据我的评论和你的代码,你想要这样的东西:
RConvergence <- read.csv("C:/Users/TA/Desktop/RConvergence./RConvergence.csv",sep = ",", header=TRUE)
RConvergence.pca <- prcomp(RConvergence[, 3:5], scale.=TRUE)
summary(RConvergence.pca)
要计算每个国家的数据,只需split
数据并使用lapply
:
RConvergence.split <- split(RConvergence, RConvergence$Country)
RConvergence.split.pca <- lapply(RConvergence.split, function(x) prcomp(x[, 3:5], scale.=TRUE))
lapply(RConvergence.split.pca, summary)