Twitter 高级搜索结果按年份分布不均

我正在使用Twitter浏览器搜索功能来超过API的一周限制，并收集历史推文用于研究目的。我正在使用在这里找到的 github 存储库： https://github.com/Jefferson-Henrique/GetOldTweets-python
这一切都工作得很好，但有一个相当奇怪的障碍。从 2013 年 1 月 1 日到 2017 年 6 月 15 日，我在德里 300 英里半径内收集带有某些关键字的推文，尽管我收到整整 4.5 年的推文，但从 2013 年 12 月到 2015 年 4 月，无论关键字或位置如何，总是有更多的推文。我在网上搜索，看看Twitter是否对它存储推文的方式进行了某种改变，但没有找到合理的解释，这让我来到了这里。这是一个代码片段(我可以提供更多，或者如果需要输出文件)：

wordsearch("headache", 0, "en", "40.7128,-74.0059", "2015-01-01", "headacheNYC2015", "300mi")

此外，这不是由于第三方来源，因为这些来源包括在内。也明显缺乏转发。我知道搜索功能只提供随机的 1% 样本，但这是一个单独的问题，因为 2015 年 4 月之后永远不会有那么多推文。如果有人知道任何可能的原因，请分享！

想出了答案。2015年，Twitter改变了地理标签的工作方式，他们添加了首选项/设置默认首选项，以关闭地理标记推文。因此，在搜索地理标记的推文时，在此之后的推文要少得多。更多细节可以在这里找到

相关内容

最新更新

热门标签：