r语言 - 如何在两个向量之间取成对并行最大值或最小值



>假设我在R中有两个向量,定义如下。

a = c(3,3,5)
b = c(2,4,6)

是否有一个函数可以给我 a 元素和 b 元素之间的成对最大值,可以在公式中运行?

我尝试这样做,max(a, b)但它没有得到所需的输出。

期望输出:

C(3,4,6)

实际输出:

6

对最大值,pmax(a, b) ,将给出c(3,4,6)

a <- c(3,3,5,NA,1)
b <- c(2,4,6,0,NA)
pmax(a, b)
# [1]  3  4  6 NA NA
pmax(a, b, na.rm = TRUE)
# [1] 3 4 6 0 1

还有一个成对最小值

pmin(a, b)
# [1]  2  3  5 NA NA
pmin(a, b, na.rm = TRUE)
# [1] 2 3 5 0 1

从这个问题/答案中提取的成对总和有时对我非常有用:

psum(a, b) # == a + b
# [1]  5  7 11 NA NA
psum(a, b, na.rm = TRUE)
# [1]  5  7 11  0  1
psum(c(-1, NA, 4), c(0, NA, NA))
# [1] -1 NA NA
psum(c(-1, NA, 4), c(0, NA, NA), na.rm = TRUE)
# [1] -1 NA  4
psum <- function(..., na.rm = FALSE) {
  dat <- do.call(cbind, list(...))
  res <- rowSums(dat, na.rm = na.rm) 
  idx_na <- !rowSums(!is.na(dat))
  res[idx_na] <- NA
  res 
}

一种牺牲b的替代方法:

# Where does b have smaller elements?
elsb <- which(a > b)
b[elsb] <- a[elsb]
b
# [1] 3 4 6

实际上,替代解决方案值得称赞。将其用于短矢量。

当向量 a 和 b 较短时,速度要快得多。更改代码中的变量 s 您可以自己尝试一下。当向量的长度为 100 (s=20) 时pmax_new速度是其两倍pmax在向量长度为 2.500 (s=500) 时超过备择。

require(microbenchmark)
pmax_new <- function(a, b) {
  elsb <- which(a > b)
  b[elsb] <- a[elsb]
  b
}
a <- c(3,3,5,NA,1)
b <- c(2,4,6,0,NA)
s <- 20
microbenchmark( pmax(rep(a, s), rep(b, s)), times = 1E6 )
microbenchmark( pmax_new(rep(a, s), rep(b, s)), times = 1E6)

最新更新