如何提取以R中的模式开头的完整字符串



我有一个包含推文列表的数据,如下所示:

"what is up", "RT @lolol wassup", "RT @joe pls help me"

我希望能够提取以RT@开头的字符串,并将其存储在另一个列表中。我目前正在使用这个:

str_extract(data, "^RT[:space:]+@[:graph:]+")

但这只提取了";RT@name";字符串的一部分,而不是整个tweet。无法弄清楚正则表达式出了什么问题。谢谢你的帮助!

我们可以使用grep来提取完整的字符串,该字符串以(^(开头,后面跟着一个空格和base R中的@

grep('^RT @', data, value = TRUE)
#[1] "RT @lolol wassup"    "RT @joe pls help me"

数据

data <- c("what is up", "RT @lolol wassup", "RT @joe pls help me")

str_extract提取您指定的模式。要在提供模式时获得完整的tweet,请使用str_subset

library(stringr)
result <- str_subset(data, "^RT[:space:]+@[:graph:]+")
result
#[1] "RT @lolol wassup"    "RT @joe pls help me"

最新更新