r语言 - 如何使用 dplyr 选择依赖于单行数据帧中列中的值的列子集



我有一个单行数据帧:

df <- structure(list(who = "Tom", who2 = "Tom", who3 = "Harry", how_many = 48, 
                 reserve = "Mary"), class = c("tbl_df", "tbl", "data.frame"
                 ), row.names = c(NA, -1L))
# A tibble: 1 x 5
  who   who2  who3  how_many reserve
  <chr> <chr> <chr>    <dbl> <chr>  
1 Tom   Tom   Harry       48 Mary   

我想按条件对列进行子集化,但出现错误: 从下面的代码中Error: condition must be a logical, not list

df %>% 
 if_else(who == who2, select(who3), select(how_many, reserve))

我想我明白为什么我会收到错误 - 如果超过 1 行,此代码将无效,但想不出另一种方法如何在dplyr管道函数链中执行此操作。

一种方式是将数据通过管道传输到表达式块中,然后运行更多标准代码以有条件地选择所需的列。

df %>% {if (pull(., who )==pull(., who2 )) {
  select(., who3)
} else {
  select(., how_many, reserve)
}}

最新更新