我们可以在Hadoop的MultipleInput
中传递不同类型的输入格式文件,即TextInputFormat
和SequenceInputFormat
吗?
和下面一样:
MultipleInputs.addInputPath (jobConf新路径(dictionarySource), SomeInputFormat . class,TranslateMapper.class);
MultipleInputs.addInputPath (jobConf新路径(dictionarySource), SomeOtherInputFormat . class,TranslateMapper.class);
简而言之,是的,该参数是InputFormat
的任何扩展
Class<? extends InputFormat> inputFormatClass
对于"如何在Reducer中处理这个问题?"- reducer的输入必须与mapper的输出相同,可以是任何你想要的