尝试从字符串中删除url:
text = re.sub(r'https?://[A-Za-z0-9./]+', '', text)
不幸的是,它适用于简单的url,但不适用复杂的url。因此,像http://www.example.com/somestuff.html
这样的字符将被删除,而像http://www.example.com/somestuff.html?query=python
这样的字符将只留下尾随位。
我想我的知识已经到了极限,所以任何帮助都会非常感激。Thx .
尝试:
r"https?:[^s]+"