我已经用尽了我能找到的一切,似乎就是不能让这个工作。我有一个。txt与行的推特帖子,我试图删除一切,但在文本中提到的@处理。
例如:Row1:这是tweet @Handle1的文本
Row2:此文本用于@Handle2和@Handle3
将导致:
第一行:@Handle1
Row2: @Handle2 @Handle3
我已经提出了一个正则表达式来选择手柄为:@[^W]*
这适用于集合中的所有句柄,即使它们后面紧跟着冒号或句号而没有空格(经常发生)。
我试着给它添加反向向前看命令:(?!(@[^W]*))
但是我真的不知道还需要添加什么才能使它工作?
谢谢!
所以你可以遍历每一行,并扫描twitter句柄。
例如,str = "This text is meant for @Handle2 and @Handle3"
str.scan(/@w+/).to_a #=> ["@Handle2", "@Handle3"]
然后你可以随意操作数组。
的w
是任意字母数字和下划线字符,您可以修改,如果需要任何其他字符。