我有一个包含推文列表的数据,如下所示:
"what is up", "RT @lolol wassup", "RT @joe pls help me"
我希望能够提取以RT@开头的字符串,并将其存储在另一个列表中。我目前正在使用这个:
str_extract(data, "^RT[:space:]+@[:graph:]+")
但这只提取了";RT@name";字符串的一部分,而不是整个tweet。无法弄清楚正则表达式出了什么问题。谢谢你的帮助!
我们可以使用grep
来提取完整的字符串,该字符串以(^
(开头,后面跟着一个空格和base R
中的@
grep('^RT @', data, value = TRUE)
#[1] "RT @lolol wassup" "RT @joe pls help me"
数据
data <- c("what is up", "RT @lolol wassup", "RT @joe pls help me")
str_extract
提取您指定的模式。要在提供模式时获得完整的tweet,请使用str_subset
。
library(stringr)
result <- str_subset(data, "^RT[:space:]+@[:graph:]+")
result
#[1] "RT @lolol wassup" "RT @joe pls help me"