字符串提取/匹配"_"但值不能有空格/空格/或数字并且具有特殊字符(即 &)



我有一组字符串,可能的例子是:AS-04_PS粉丝(兴趣(科幻游戏Interest_IND,AS-08_5-694640-113017和CRM_INDAS-08_5-694640-113017_IND。

我想提取下划线之间的序列。

我使用了代码: str_match(x,"_(\w+?)_IND")[,2]

我注意到如果我去掉空格和括号,这段代码效果会更好。有什么方法可以在不弄乱数据的情况下正确提取?

你在找这个吗?

x <- "AS-04_PS Fans (Interest) Sci-Fi Games Interest_IND, AS-08_5-694640-113017 & CRM_INDAS-08_5-694640-113017_IND"
str_split(x, "_IND")
# [[1]]
# [1] "AS-04_PS Fans (Interest) Sci-Fi Games Interest" ", AS-08_5-694640-113017 & CRM"                  "AS-08_5-694640-113017"                         
# [4] ""

最新更新