在 R 中,如何在运行具有大量变量的多元回归后仅提取有效变量



在 R 中运行多元回归后,回归摘要指示带有星号的重要变量。在我正在处理的数据集中,有近 2000 个变量,R 标识的有效变量包括 50 多个变量。有没有办法从回归摘要中单独获取重要变量的列表。

这是为什么您不应该做您要求我们做的事情的一个例子:

randf <- as.data.frame(matrix(rnorm(800*400), 800, 400))
names(randf)[1] <- "Y"
big.mod <- lm(Y ~ ., data=randf)
sum( summary(big.mod)$coefficients[ ,4] < 0.05 )
#[1] 22

因此,我们得到了 22 个有效系数(其中一些是"高度显着的"),只是将 400 个随机变量与另一个随机变量回归。

最新更新