r-summarySE()[Rmisc包]返回的置信区间ci值错误



我不明白Rmisc包中的summarySE((是如何计算数据的置信区间(ci(的。这些值似乎不正确。

例如,运行summarySE(data = df, measurevar = "numbers", groupvars = "conditions", conf.interval = 0.95)后,输出显示:

conditions  N numbers        sd        se        ci
1 constructionA 10   6.025 0.3987829 0.1261062 0.2852721
2 constructionB 10   1.925 0.3545341 0.1121135 0.2536184

然而,结构A的置信区间应为6.025±1.96 x(0.398729(/√10,即6.025±0.24716366。我不明白应用summarySE后0.2852721的值是从哪里来的。。。应该是0.24716366吗?

有人能告诉我这里怎么了吗?

谢谢!

置信区间的常见构造是

(统计(+/-c*(统计标准误差(

其中c是临界值。c=1.96(近似(是正态分布z统计量和95%置信区间的临界值,但这不是CI或任何东西的定义的一部分,这只是如果你认为你的统计量是正态分配的,你得到的CI。

然而,包括summarySE()在内的大多数置信区间计算都使用t分布而不是正态分布来计算临界值,因为当样本量较小时,它们产生的结果比正态分布更准确(当样本量较大时,结果几乎相同(。

这里,您的样本量仅为N=10,因此正态分布1.96和t统计量的临界值之间的差异是显著的。自由度为10-1=9的t分布的第2.5个百分位是CCD_ 3-2.262157。因此,对于双侧95%置信区间,c=2.262157。

0.1261062*2.262157=0.285272,这就是置信区间列的来源。

最新更新