Twitter Streaming (Twitter 4j api) using apache spark stream



我想从用户那里获得推文,他们谈到了city x中可用的某种服务/商品/产品。假定city xNew York,服务是关于law and order。使用用户位置或使用包含城市名称(New York(和服务名称(law and order(或主题标签(#NewYork#Law#Order(的关键字过滤推文是否更有效?

一些研究表明,只有2%的推文被地理标记。所以我会使用带有哈斯标签的城市名称("纽约"(来确定。

最新更新