单词对计数对应位于段落边界中

  • 本文关键字:于段落 边界 单词 hadoop
  • 更新时间 :
  • 英文 :


单词对计数需要帮助,对应该在段落边界中。例如,上一个单词不应该是文本文件中段落的最后一个单词,下一个单词不应该是字数对中新段落的第一个单词。 你能告诉我如何使用Java在Hadoop(框架工作)中实现

请更好地解释您需要什么以及情况是什么。 如果我理解正确,您将希望您的 map Reduce 作业逐段处理文本,在映射器中实现您想要的逻辑(您使用上一个单词/下一个单词指定的内容),并在化简器中实现通常的求和 reduce() 函数

最新更新