似乎并非所有我使用过滤器获得的推文都包含该项目(在这种情况下为"健康")。如何仅获得包含此特定项目的推文?有人可以帮助我吗?提前非常感谢!!
这是我使用过滤器时的行:sapi.filter(locations=[-79.55, 37.883, -75.067, 39.717],track = ["health"])
遗憾的是,流式处理 API 不允许按位置和术语进行筛选。从文档中:
边界框不充当其他筛选器参数的筛选器。例如,track=twitter&locations=-122.75,36.8,-121.75,37.8将匹配任何包含Twitter一词的推文(甚至是非地理推文)或来自旧金山地区的推文。
因此,从本质上讲,您看到一些不包含"健康"一词的推文的原因是因为您收到的推文包含"健康"一词,或者位于您的边界框内(在本例中为 locations=[-79.55, 37.883, -75.067, 39.717]
)。
但是,你可以尝试按术语进行筛选,然后解析该位置的推文数据,或者按位置筛选,然后在推文文本中搜索你的术语。如果位置是必要的,我可能会建议后者来限制你的推文消费范围。
您只需要在代码中添加此行即可。
twitterStream.filter(track=["health"])