我有一个这样的数据框架:
1 2
aquiles_alcatra_Mat_15 picanha
aquiles_alcatra_Mat_15 picanha
alcatra_Mat_15 picanha
alcatra_Mat_20 picanha
alcatra_Mat_25 picanha
picanha_Mat_20 picanha
picanha_Mat_25 picanha
,我想这样做:
1 2
aquiles_alcatra_Mat_15 alcatra
aquiles_alcatra_Mat_15 alcatra
alcatra_Mat_15 alcatra
alcatra_Mat_20 alcatra
alcatra_Mat_25 alcatra
picanha_Mat_20 picanha
picanha_Mat_25 picanha
如果我有alcatra
作为column 1
上的单词的一部分,我将只需要alcatra
在column 2
上。
我知道我可以用这个:
file$2[ file$1 == 'aquiles_alcatra_Mat_15'] <- 'alcatra'
但我有几个情况几乎300。我试着这样写:
file$2[ file$1 == '.*alcatra*'] <- 'alcatra'
但不工作。
一个可能的解决方案,基于dplyr
和stringr::str_detect
:
library(tidyverse)
df %>%
mutate(V2 = if_else(str_detect(V1, "alcatra"), "alcatra", V2))
#> V1 V2
#> 1 aquiles_alcatra_Mat_15 alcatra
#> 2 aquiles_alcatra_Mat_15 alcatra
#> 3 alcatra_Mat_15 alcatra
#> 4 alcatra_Mat_20 alcatra
#> 5 alcatra_Mat_25 alcatra
#> 6 picanha_Mat_20 picanha
#> 7 picanha_Mat_25 picanha
您可以使用以下代码:
library(dplyr)
df %>%
mutate(v2 = case_when(grepl("alcatra", v1) ~ "alcatra",
grepl("picanha", v1) ~ "picanha"))
输出:
v1 v2
1 aquiles_alcatra_Mat_15 alcatra
2 aquiles_alcatra_Mat_15 alcatra
3 alcatra_Mat_15 alcatra
4 alcatra_Mat_20 alcatra
5 alcatra_Mat_25 alcatra
6 picanha_Mat_20 picanha
7 picanha_Mat_25 picanha
数据df <- data.frame(v1 = c("aquiles_alcatra_Mat_15", "aquiles_alcatra_Mat_15", "alcatra_Mat_15", "alcatra_Mat_20", "alcatra_Mat_25", "picanha_Mat_20", "picanha_Mat_25"),
v2 = c("picanha", "picanha", "picanha", "picanha", "picanha", "picanha", "picanha"))