r语言 - 使用case_when，如何改变一个新的列表列，其中嵌套一个向量? - r - Using case_when, how to mutate a new list-column that nests a vector within? 小贝子编程网

我试图使用dplyr的case_when()根据其他列中的条件突变一个新列。但是，我希望新列嵌套一个向量。

考虑以下玩具数据。在此基础上，我想总结一下英国的地理疆域。

library(tibble)
set.seed(1)
my_mat <- matrix(sample(c(TRUE, FALSE), size = 40, replace = TRUE), nrow = 10, ncol = 4) 
colnames(my_mat) <- c("England", "Wales", "Scotland", "Northern_Ireland")
my_df <- as_tibble(my_mat)
> my_df
## # A tibble: 10 x 4
##    England Wales Scotland Northern_Ireland
##    <lgl>   <lgl> <lgl>    <lgl>           
##  1 TRUE    TRUE  TRUE     FALSE           
##  2 FALSE   TRUE  TRUE     FALSE           
##  3 TRUE    TRUE  TRUE     TRUE            
##  4 TRUE    TRUE  TRUE     FALSE           
##  5 FALSE   TRUE  TRUE     TRUE            
##  6 TRUE    FALSE TRUE     TRUE            
##  7 TRUE    FALSE FALSE    FALSE           
##  8 TRUE    FALSE TRUE     TRUE            
##  9 FALSE   FALSE TRUE     FALSE           
## 10 FALSE   TRUE  FALSE    FALSE

我想改变一个新的collective_geo_territory列。

如果England,Scotland,Wales和Northern_Ireland都是TRUE，那么我们说这是United_Kingdom。
否则，如果只有England,Scotland和Wales是TRUE，那么我们说这是Great_Britain
任何其他组合将简单地返回一个包含TRUE国家名称的矢量。

我的尝试到目前为止，我知道如何处理条件(1)和(2)上面详细说明，使用以下代码

library(dplyr)
my_df %>%
mutate(collective_geo_territory = case_when(England == TRUE & Wales == TRUE & Scotland == TRUE & Northern_Ireland == TRUE ~ "United_Kingdom",
England == TRUE & Wales == TRUE & Scotland == TRUE ~ "Great_Britain"))

期望输出值

但是，我想实现collective_geo_territory列的输出，如下所示:

## # A tibble: 10 x 5
##      England Wales Scotland Northern_Ireland collective_geo_territory
##      <lgl>   <lgl> <lgl>    <lgl>            <list>                   
##   1  TRUE    TRUE  TRUE     FALSE            <chr [1]>   # c("Great_Britain")           
##   2  FALSE   TRUE  TRUE     FALSE            <chr [2]>   # c("Wales", "Scotland")                      
##   3  TRUE    TRUE  TRUE     TRUE             <chr [1]>   # c("United_Kingdom")        
##   4  TRUE    TRUE  TRUE     FALSE            <chr [1]>   # c("Great_Britain")
##   5  FALSE   TRUE  TRUE     TRUE             <chr [3]>   # c("Wales", "Scotland", "Northern_Ireland")
##   6  TRUE    FALSE TRUE     TRUE             <chr [3]>   # c("England", "Scotland", "Northern_Ireland")
##   7  TRUE    FALSE FALSE    FALSE            <chr [1]>   # c("England") 
##   8  TRUE    FALSE TRUE     TRUE             <chr [3]>   # c("England", "Scotland", "Northern_Ireland")
##   9  FALSE   FALSE TRUE     FALSE            <chr [1]>   # c("Scotland") 
##   10 FALSE   TRUE  FALSE    FALSE            <chr [1]>   # c("Wales")

这里有一个方法:

library(purrr) # used for pmap
my_df %>%
mutate(collective_geo_territory = case_when(
England & Wales & Scotland & Northern_Ireland ~ list("United_Kingdom"),
England & Wales & Scotland ~ list("Great_Britain"),
TRUE ~ pmap(my_df, ~names(my_df)[c(...)]))
)

基本上，最后一行的工作方式如下:

左边可以简单地为TRUE，因为case_when()终止于第一个相关的TRUE。因此，只有当条件1和2失败时，我们才会到达这一行。
右边基本上说迭代我的数据集(pmap)的行，并应用以下函数:获取我的数据集(names)和子集([])列的名称，仅对那些值为真(包含在c()中)

附加说明:

请注意，我还必须将前两个条件(例如"United_Kingdom")的右侧幻灯片包装在list()中，因为case_when()要求结果向量的一致类型
我把多余的England == TRUE(和其他国家一样)改成了England。由于这些列已经包含逻辑值，因此不需要重新检查它们的值，这使得代码更具可读性。

r语言 - 使用case_when，如何改变一个新的列表列，其中嵌套一个向量?

期望输出值

相关内容

最新更新

热门标签：