r语言 - For loop and lapply



首先,我使用for loop作为数字向量,它工作得很好。

当我使用lapply函数时,结果不是我想要的。我只需要列表中的一个元素。

这是我的例子

# With for loop, the outcome is one vector of numbers
x <- c(0.2,0.5,0.03,0.006,0.08)
p.value <- NULL
for (i in 1:length(x)){
if(x[i] > 0.5 p.value[i] <- (1-x[i])*2
else p.value[i] <- x[i]*2
# with lapply
lapply(x, function(x) {if(x > 0.5) p.value <- (1-x)*2 else p.value <- x*2

lapply的结果是相同结果的组合。我有点意识到这个问题,但我不知道如何改变我的代码。对此有什么建议吗?

这可以通过向量化的方式解决,因此您不需要for循环或lapply

p.value <- ifelse(x > 0.5, (1 - x), x) * 2

lapply代码确实给了我for循环的预期输出,但您可以更改一些东西。

  • 使用sapply,因为输出是矢量
  • p.value赋值在sapply之外,而不是在函数内。
  • 既然你已经有了一个名为x的向量,把匿名函数中的变量改为另一个名字
p.value <- sapply(x, function(y) if(y > 0.5) (1-y)*2 else y*2)

您可以使用replace,它比ifelse更快。

replace(x, x > .5, 1 - x)*2
# [1] 0.400 1.000 0.060 0.012 0.160
基准

x <- sample(x, 1e6, replace=T)
microbenchmark::microbenchmark(ifelse=ifelse(x > 0.5, (1 - x), x) * 2,
replace=replace(x, x > .5, 1 - x)*2)
# Unit: milliseconds
#    expr       min       lq     mean   median       uq      max neval cld
#  ifelse 25.049546 31.29303 39.53500 36.23981 42.06574 124.9903   100   b
# replace  8.074329 11.06676 18.68296 14.02976 16.99336 100.2051   100  a 

尝试sapply代替lapply。简化列表解

最新更新