尝试在正则表达式中选择除Twitter句柄以外的所有文本



我已经用尽了我能找到的一切,似乎就是不能让这个工作。我有一个。txt与行的推特帖子,我试图删除一切,但在文本中提到的@处理。

例如:

Row1:这是tweet @Handle1的文本

Row2:此文本用于@Handle2和@Handle3

将导致:

第一行:@Handle1

Row2: @Handle2 @Handle3

我已经提出了一个正则表达式来选择手柄为:@[^W]*

这适用于集合中的所有句柄,即使它们后面紧跟着冒号或句号而没有空格(经常发生)。

我试着给它添加反向向前看命令:(?!(@[^W]*))

但是我真的不知道还需要添加什么才能使它工作?

谢谢!

所以你可以遍历每一行,并扫描twitter句柄。

例如,

str = "This text is meant for @Handle2 and @Handle3"
str.scan(/@w+/).to_a #=> ["@Handle2", "@Handle3"]

然后你可以随意操作数组。

w是任意字母数字和下划线字符,您可以修改,如果需要任何其他字符。

最新更新