R 中两个序数变量的相关性



我想测试两个序数变量的矛手相关性。

x=c(1,2,3)
y=c(4,3,6)
x=ordered(x)
y=ordered(y)
cor(x,y,methods="spearman")

我总是得到"cor(x, y( 中的错误:"x'必须是数字">

正确的方法是什么?

两种方法:

  1. 使用 as.numeric .

    x=c(1,2,3)
    y=c(4,3,6)
    x=ordered(x)
    y=ordered(y)
    cor(as.numeric(x), as.numeric(y), method="spearman")
    [1] 0.5
    

请注意,这并不是将 x 和 y 简单地视为连续数。它把他们当作等级。

as.numeric(y)
[1] 2 1 3

此方法将允许您忽略 NA 值。

x=c(1,2,3, NA)
y=c(4,3,6, 7)
x=ordered(x)
y=ordered(y)
cor(as.numeric(x), as.numeric(y), 
    method="spearman", use="pairwise.complete.obs")
[1] 0.5
  1. 您可以使用将处理有序因素的包pspearman

    x=c(1,2,3)
    y=c(4,3,6)
    x=ordered(x)
    y=ordered(y)
    library(pspearman)
    spearman.test(x,y)
    
    Spearman's rank correlation rho
    data:  x and y
    S = 2, p-value = 1
    alternative hypothesis: true rho is not equal to 0
    sample estimates:
    rho 
    0.5 
    

或者,如果要减少一些输出,可以使用:

spearman.test(x,y)$estimate
rho 
0.5 

您遇到了一些问题:

  1. 使用"排序"将创建一个因子,您可以使用rank
  2. 你有一个错别字,应该是method=...而不是methods=...

--

x=c(1,2,3)
y=c(4,3,6)
x=rank(x)
y=rank(y)
cor(x,y,method="spearman")

最新更新