采用卡方检验的正确方法



我正在尝试确定今天的数据是否真的在四个类别中与昨天不同。

我统计的数据是:

data <-data.frame(yesterday=c(10741, 1575, 174, 2),
today = c(11987, 1705, 211, 2), 
row.names = c("a", "b", "c", "unknown"))
> data
yesterday today
a           10741 11987
b            1575  1705
c             174   211
unknown         2     2

所以我用统计数据包中的卡方来测试,方法是:

stats::chisq.test(x = data$yesterday, y = data$today)

结果是:

Pearson's Chi-squared test
data:  data$yesterday and data$today
X-squared = 12, df = 9, p-value = 0.2133

我的问题是,我认为这应该与相同

stats::chisq.test(data)

但是你可以看到结果是完全不同的。

Pearson's Chi-squared test
data:  data
X-squared = 1.3846, df = 3, p-value = 0.7092

所以。。。。使用该测试来比较来自同一数据集的两个样本的正确方法是什么?

我认为问题在于,在第一种情况下,您将chisq.test应用于列联表的列,而函数期望x和y是因子。因此,您提供列联表的版本应该是正确的,至少它与文档中的示例相对应

最新更新