r语言 - 模拟数千次回归并获得 p 值 - r - Simulating thousands of regressions and obtaining p-values 小贝子编程网

我想在R中进行一些基本的模拟，以检查p值的性质。我的目标是查看大样本量是否趋向于较小的 p 值。我的想法是生成 1,000,000 个数据点的随机向量，将它们相互回归，然后绘制 p 值的分布并寻找偏斜。

这就是我到目前为止的想法：

x1 = runif(1000000, 0, 1000) 
x2 = runif(1000000, 0, 1000) 
model1 = lm(x2~x1)

使用从另一个线程获取的代码：

lmp <- function (modelobject) {
    if (class(modelobject) != "lm") stop("Not an object of class 'lm' ")
    f <- summary(modelobject)$fstatistic
    p <- pf(f[1],f[2],f[3],lower.tail=F)
    attributes(p) <- NULL
    return(p)
  }
lmp(model1) 
0.3874139

关于如何为 1000 个甚至更多模型执行此操作的任何建议？谢谢！

请参阅?replicate...但是您正在计算的 p 值假设高斯误差不是均匀误差（并不是说这在 n=10^6 时很重要）

具体来说，像这样：

nrep <- 1000
ndat <- 1000000
results <- replicate(nrep, {
     x1=runif(ndat, 0, 1000);
     x2=runif(ndat, 0, 1000);
     model1=lm(x1 ~ x2);
     lmp(model1)
     })

应该工作，但是运行需要很长时间。

我建议将 nrep 和 ndat 变小以尝试一下。

r语言 - 模拟数千次回归并获得 p 值

相关内容

最新更新

热门标签：