我最近从SPSS切换到R进行一些数据分析。作为其中的一部分,我在 R 中运行了一些以前在 SPSS 中已经完成的分析,只是为了拥有一个有意义的漂亮整洁的脚本。
在这种情况下,我的数据是9名参与者在孤立和封闭的环境中对敌意的自我评价。我测试了五次(夏季,秋季,冬季,春季,夏季)。数据是非正态分布的。
我在SPSS中进行了弗里德曼测试,这给了我p=.012, χ2(4df)=12.79
很久以前。我今天在 R 中重新运行了测试,它给了我这个:p=.951 (χ2(4df)=.69)
.这真的吓坏了我,因为它让我有理由怀疑到目前为止的所有分析。
一旦我发现了这一点,我就将SPSS文件重新导出到.csv
,用我的R脚本打开它并重新运行弗里德曼测试。检查我是否意外使用了不同的数据文件。绝对不是这样。
我使用了Andy Field描述的弗里德曼测试:
Summer1 <- c(2,0,0,0,0,0,0,0,0)
Autumn <- c(3,0,1,0,0,4,2,0,1)
Winter <- c(1,0,0,0,0,2,5,1,1)
Spring <- c(1,0,2,2,2,8,4,0,1)
Summer2 <- c(3,0,2,1,0,4,7,1,1)
Hostility <- matrix(c(Summer1, Autumn, Winter, Spring, Summer2), nrow=9, byrow=TRUE)
friedman.test(Hostility)
有没有人对此有解释,或者知道哪个结果是正确的?
检查你的矩阵是否真的看起来像你认为应该的样子总是一个好主意:
> Hostility
[,1] [,2] [,3] [,4] [,5]
[1,] 2 0 0 0 0
[2,] 0 0 0 0 3
[3,] 0 1 0 0 4
[4,] 2 0 1 1 0
[5,] 0 0 0 2 5
[6,] 1 1 1 0 2
[7,] 2 2 8 4 0
[8,] 1 3 0 2 1
[9,] 0 4 7 1 1
问题出在byrow=TRUE
.如果构造正确,弗里德曼测试与SPSS一致:
> Hostility <- matrix(c(Summer1, Autumn, Winter, Spring, Summer2), nrow=length(Summer1))
> friedman.test(Hostility)
Friedman rank sum test
data: Hostility
Friedman chi-squared = 12.794, df = 4, p-value = 0.01233
这是 R 代码中的一个错误。 您可以按行而不是按列将数据读入矩阵。 在matrix()
函数调用中,只需将byrow
参数更改为FALSE
即可。 考虑:
...
Hostility <- matrix(c(Summer1, Autumn, Winter, Spring, Summer2), nrow=9, byrow=TRUE)
Hostility
# [,1] [,2] [,3] [,4] [,5]
# [1,] 2 0 0 0 0
# [2,] 0 0 0 0 3
# [3,] 0 1 0 0 4
# [4,] 2 0 1 1 0
# [5,] 0 0 0 2 5
# [6,] 1 1 1 0 2
# [7,] 2 2 8 4 0
# [8,] 1 3 0 2 1
# [9,] 0 4 7 1 1
Hostility2 <- matrix(c(Summer1, Autumn, Winter, Spring, Summer2), nrow=9, byrow=FALSE)
Hostility2
# [,1] [,2] [,3] [,4] [,5]
# [1,] 2 3 1 1 3
# [2,] 0 0 0 0 0
# [3,] 0 1 0 2 2
# [4,] 0 0 0 2 1
# [5,] 0 0 0 2 0
# [6,] 0 4 2 8 4
# [7,] 0 2 5 4 7
# [8,] 0 0 1 0 1
# [9,] 0 1 1 1 1
friedman.test(Hostility2)
# Friedman rank sum test
#
# data: Hostility2
# Friedman chi-squared = 12.794, df = 4, p-value = 0.01233