如何使用map reduce计算给定推文集中的所有主题标签



我想有一个计数器来检查最受欢迎的主题标签。
现在的问题是每条推文可以有多个主题标签,在这种情况下,如何将主题标签设置为键? 因为在每次迭代中,我都有来自每条推文的主题标签数组。
如何解决这个问题以适应map-reduce范式?

您可以在单个映射调用中进行多次调用以写入/收集。

在推文中搜索所有 HasTag 并对其进行迭代,每次调用 write/collect

最新更新