如何在MR中为输出提供列名?
假设我有一个简单的文本,我想使用一个简单的字数统计程序
来计数但是我想使用列名获取输出,这可能吗?
您可以通过覆盖化简器的设置方法来实现此目的。您可以将自定义标头添加到设置方法中,然后是 map reduce 输出。
遵循 MR API 文档:http://hadoop.apache.org/docs/stable/api/org/apache/hadoop/mapreduce/Reducer.html