在查看R中用于计算(以及其他)Pearson相关性的cor.test函数时,我发现后来用于计算p值的t-统计量是
STATISTIC <- c(t = sqrt(df) * r/sqrt(1 - r^2))
其中r是相关度量,df是自由度的数量。
但皮尔逊相关性的t检验似乎是:(参见。http://en.wikipedia.org/wiki/Pearson_product-moment_correlation_coefficient#Testing_using_Student.27s_t-分配)
sqrt( ( n - 2 ) / ( 1 - r^2 ) )
和往常一样,鉴于cor.test被广泛使用,我首先怀疑这是我方的误解。有人知道cor.test中使用的定义是否正确吗?
感谢
如果您进一步查看代码,您会发现它们实际上是等效的。
首先,你忘记了维基百科方程式中的r
。你的方程式应该是:
t = r*sqrt((n-2)/(1-r^2))
现在,让我们对STATISTIC <- c(t = sqrt(df) * r/sqrt(1 - r^2))
进行一些简化
df
实际上是n-2
t = sqrt(n-2)*r/sqrt(1-r^2)
重写
t = r * sqrt(n-2)/sqrt(1-r^2)
简化
t = r*sqrt((n-2)/(1-r^2))
你有你的对等。