我是hadoop的新手,在这里我正在尝试编写一个MR作业,该作业从多个文件中获取输入并将输出显示为word-文件列表,但我无法获取ile名称
- 例如:hadoop [文件 1、文件 2、文件 3] 配置单元 [文件 2、文件 3]
这与字数统计程序非常相似。
从地图发出,
Word,Filename
要提取文件名,
String fileName = ((FileSplit) context.getInputSplit()).getPath().getName();
在减少中,
默认情况下,您将获得每个单词分组的文件名。您可以迭代并执行所需的操作。