我有一个1000多行37列的数据帧,我想从字符串中删除第一个单词,包括下划线,并保留字符串的剩余部分:
示例
Column A Column B Column C
Mid-size colourblind_RED_Pglasses_Vision xxx xxx
High-size cannotEat_JAM_Pots_Jammie yyy yyy
我想从包括下划线的字符串中删除第一个单词,并保留A列字符串的剩余部分,例如RED_Pglasses_Vision。
您可以使用lookaround:
library(stringr)
str_extract(x, "(?<=_).*")
其中x
是带有字符串的向量,(?<=_)
是lookbacking,断言匹配必须在第一个下划线之后开始
我们可以使用base R
中的trimws
trimws(str1, whitespace = "[^_]+_")
[1] "RED_Pglasses_Vision" "JAM_Pots_Jammie"
数据
str1 <- c("Mid-size colourblind_RED_Pglasses_Vision", "High-size cannotEat_JAM_Pots_Jammie")