使用python和regex从reddit评论中删除链接



我想删除Reddit使用格式的链接

comment = "Hello this is my [website](https://www.google.com)"
no_links = RemoveLinks(comment)
# no_links == "Hello this is my website"

我发现了一个关于同一件事的类似问题,但我不知道如何将其翻译成python。

我对regex不太熟悉,所以如果你能解释一下发生了什么,我将不胜感激。

您可以执行以下操作:

import re
pattern = re.compile('[(.*?)](.*?)')
comment = "Hello this is my [website](https://www.google.com)"
print(pattern.sub(r'1', comment))

线路:

pattern = re.compile('[(.*?)](.*?)')

创建一个正则表达式模式,该模式将搜索由方括号包围的任何内容,然后搜索由括号包围的所有内容,'?'表示它们应该尽可能少地匹配文本(非贪婪(。

函数sub(r'1', comment)用第一个捕获组替换匹配,在这种情况下是括号内的文本。

有关regex的更多信息,我建议您阅读本文。

最新更新