我们得到了两组区间A
和B
。我所说的区间是指一对有序的整数,比如c(2,5)
。我想找到所有有重叠的区间对——一个来自A
,一个来自于B
。
例如,如果A和B如下:
A=c(c(1,7), c(2,5), c(4, 16))
B=c(c(2,3), c(2,20))
那么FindOverlap(A, B)
应该返回如下矩阵(唯一的零元素是因为A
的第三个区间与B
的第一个区间不重叠):
1 1
1 1
0 1
你有什么有效的想法吗?
intervals包似乎在这里提供了一个解决方案:
require("intervals")
A <- rbind(A1=c(1,7), A2=c(2,5), A3=c(4, 16))
B <- rbind(B1=c(2,3), B2=c(2,20))
# here you can also define if it is an closed or open interval
Aint <- Intervals(A)
Bint <- Intervals(B)
# that should be what you are looking for
interval_overlap(Aint, Bint)
一个很好的演示
下面是我为做同样的事情而编写的一个小函数。它可以显著改善。不过问题很有趣。
f <- function(A,B){
tmpA <- lapply( A , function(x) min(x):max(x) )
tmpB <- lapply( B , function(x) min(x):max(x) )
ids <- expand.grid( seq_along( tmpA ) , seq_along( tmpB ) )
res <- mapply( function(i,j) any( tmpA[[i]] %in% tmpB[[j]] ) , i = ids[,1] , j = ids[ ,2] )
out <- matrix( res , nrow = length( tmpA ) )
return( out * 1 )
}
f(A,B)
[,1] [,2]
[1,] 1 1
[2,] 1 1
[3,] 0 1