我有两个矩阵a&b在r中,排相等,但列数不同。
我想用每个矩阵通过行进行kolomogrov-smirnov测试。也就是说,第一个测试是ks.test(as.vector(A[1,]), as.vector(B[1,])
,第二个测试是ks.test(as.vector(A[2,]), as.vector(B[2,])
等。理想情况下,将每个测试的结果存储在向量或数据框架中。
我认为mapply
是合适的,但它不断给我带来比预期更多的结果。我认为它是按元素而不是行执行测试元素。这是我的代码块: mapply(ks.test, x=A, y=B)
仅测试第一行时,当我简单地运行时,无法正常工作: mapply(ks.test, x=as.vector(A[1,]), y=as.vector(B[1,]))
如何获得n p值的所需输出 其中n是我的原始矩阵的行数。?
这是我每个矩阵的第一行:
> A[1,]
[1] 0 0 0 0 0 0 0 0 0
> B[1,]
V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 V11 V12 V13 V14 V15 V16 V17 V18 V19 V20 V21 V22 V23 V24 V25 V26 V27 V28 V29 V30 V31 V32 V33 V34 V35 V36
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
您可以通过在行索引上使用的sapply
获得想要的东西
sapply(1:nrow(A), function(i) ks.test(as.vector(A[i,]), as.vector(B[i,])))
实际上,看起来唯一有趣的部分是p值,因此可以用
简化这一点sapply(1:nrow(A), function(i) ks.test(as.vector(A[i,]), as.vector(B[i,]))$p)
[1] 0.01587302 0.01587302 0.01587302 0.01587302
我们可以使用Map/mapply
。在使用Map/mapply
时,我们需要了解它将功能应用于输入数据的相应元素。如果输入数据是向量,则相应的元素将是向量的每个元素,类似地,matrix
是具有尺寸的vector
。它将在每个元素上应用功能。因此,我们可以通过row
split
matrix
,然后将功能应用于相应的list
元素
unlist(mapply(ks.test, split(A, row(A)), split(B, row(B)))[2,], use.names = FALSE)
#[1] 0.3571429 0.8730159 0.8730159 0.3571429 0.8730159
或使用for
循环
r1 <- numeric(nrow(A))
for(i in seq_len(nrow(A))){
r1[i] <- ks.test(A[i,], B[i,])$p.value
}
r1
#[1] 0.3571429 0.8730159 0.8730159 0.3571429 0.8730159
数据
set.seed(24)
A <- matrix(rnorm(25), 5, 5)
set.seed(42)
B <- matrix(rnorm(25), 5, 5)