我在以下向量中具有这种类型的数据。
v1 <- c(15, 20, 30, 45)
v2 <- c(17, 23, 30, 55)
我只想在每个元素属于v1
中的元素的一定范围内匹配。我的代码是:
ifelse(v1>v2-5, match(v1, v2), 0)
我的预期输出是:[1] 1 2 3 0
相反,我得到: [1] NA NA 3 0
为什么前两个元素不匹配?
也许您正在寻找findInterval
。
findInterval(v1, c(0, v2))
#[1] 1 2 4 4
结果的第三值是错误的,因此参数left.open
必须设置为TRUE
。
findInterval(v1, c(0, v2), left.open = TRUE)
#[1] 1 2 3 4
ifelse(v1 > v2 - 5, findInterval(v1, c(0, v2), left.open = TRUE), 0)
#[1] 1 2 3 0
第三个值是v1
中与v2
匹配的唯一元素,因此即使满足您的状况,您也可以获得其他元素的NA
。ifelse()
将插入返回 TRUE
值条件的元素的以下值:
match(v1, v2)[v1 > v2 - 5]
# [1] NA NA 3
您可以尝试在那里使用序列:
ifelse(v1 > v2 - 5, seq_along(v1), 0)
# [1] 1 2 3 0
sapply(v1, function(x){
temp = which(v2 >= x & abs(v2 - x) < 5)[1]
replace(temp, is.na(temp), 0)
})
#[1] 1 2 3 0