使用Tweepy和Twitter的Stream API,它实时返回Tweet对象。我的应用程序中查询不同 API 的部分与推文文本中的 URL 配合不佳,因此我使用 Python re
模块将它们替换为无害的标识符字符串。但是,我找不到需要从文本中解析的网址。我不必自己在文本中搜索 URL,而是决定使用 API 提供的 URL 并在文本中进行"查找和替换"。
这是有关 API 为我提供的文档。它提供了一个 t.co 网址、一个显示网址和一个完全展开的网址。仅使用 t.co URL 的问题在于,twiter 不会自动将推文中的所有 url 转换为 t.co,只会将超过一定长度的 url 转换为。这意味着 t.co 网址并不总是与推文文本中显示的网址相同。
所以我需要弄清楚如何从 API 获取实际出现在推文文本中的 URL 版本。
谢谢!埃瓦姆维德
尝试将其用于extended_url
:
tweet_url = str(tweet.expanded_url) # you might not need str(),
#test it yourself if you'd like.
# Replace tweet by the loop/function you have the json extracted with
tweet_url = tweet_url.replace('\', '')
print(tweet_url)
你应该给你链接,没有你想要的方式。