如何在r中提取字符串

  • 本文关键字:提取 字符串 r
  • 更新时间 :
  • 英文 :


我有一个1000多行37列的数据帧,我想从字符串中删除第一个单词,包括下划线,并保留字符串的剩余部分:
示例

Column A                                    Column B       Column C
Mid-size colourblind_RED_Pglasses_Vision           xxx         xxx
High-size cannotEat_JAM_Pots_Jammie                yyy         yyy

我想从包括下划线的字符串中删除第一个单词,并保留A列字符串的剩余部分,例如RED_Pglasses_Vision。

您可以使用lookaround:

library(stringr)
str_extract(x, "(?<=_).*")

其中x是带有字符串的向量,(?<=_)是lookbacking,断言匹配必须在第一个下划线之后开始

我们可以使用base R中的trimws

trimws(str1, whitespace = "[^_]+_")
[1] "RED_Pglasses_Vision" "JAM_Pots_Jammie"  

数据

str1 <- c("Mid-size colourblind_RED_Pglasses_Vision", "High-size cannotEat_JAM_Pots_Jammie")