Mapreduce作业,它从多个文件中获取输入,并将输出显示为word-文件列表



我是hadoop的新手,在这里我正在尝试编写一个MR作业,该作业从多个文件中获取输入并将输出显示为word-文件列表,但我无法获取ile名称

  • 例如:hadoop [文件 1、文件 2、文件 3] 配置单元 [文件 2、文件 3]

这与字数统计程序非常相似。

从地图发出,

Word,Filename

要提取文件名,

String fileName = ((FileSplit) context.getInputSplit()).getPath().getName();

在减少中,

默认情况下,您将获得每个单词分组的文件名。您可以迭代并执行所需的操作。

相关内容

  • 没有找到相关文章

最新更新