Twitter 高级搜索结果按年份分布不均



我正在使用Twitter浏览器搜索功能来超过API的一周限制,并收集历史推文用于研究目的。我正在使用在这里找到的 github 存储库: https://github.com/Jefferson-Henrique/GetOldTweets-python
这一切都工作得很好,但有一个相当奇怪的障碍。从 2013 年 1 月 1 日到 2017 年 6 月 15 日,我在德里 300 英里半径内收集带有某些关键字的推文,尽管我收到整整 4.5 年的推文,但从 2013 年 12 月到 2015 年 4 月,无论关键字或位置如何,总是有更多的推文。我在网上搜索,看看Twitter是否对它存储推文的方式进行了某种改变,但没有找到合理的解释,这让我来到了这里。 这是一个代码片段(我可以提供更多,或者如果需要输出文件):

wordsearch("headache", 0, "en", "40.7128,-74.0059", "2015-01-01", "headacheNYC2015", "300mi")

此外,这不是由于第三方来源,因为这些来源包括在内。也明显缺乏转发。我知道搜索功能只提供随机的 1% 样本,但这是一个单独的问题,因为 2015 年 4 月之后永远不会有那么多推文。 如果有人知道任何可能的原因,请分享!

想出了答案。2015年,Twitter改变了地理标签的工作方式,他们添加了首选项/设置默认首选项,以关闭地理标记推文。因此,在搜索地理标记的推文时,在此之后的推文要少得多。更多细节可以在这里找到

最新更新