在一个MapReduce Job中使用多个key



我是hadoop新手。我试图运行MapReduce (Java编程),其中的关键是多个关键(文本)。我应该使用哪种类型的数组来存储这些键,然后将它们作为参数传递给outputCollector?谢谢! !

您应该编写自己的类implements WritableComparable<YourClassName>来将键存储在一个简洁的对象中。

如果它只是一些文本值,我建议只是发送它们作为一个分隔的字符串。它既方便又直接。或者你可以按照Quetzalcoatl的建议去做。你可能会发现这两个问题很有用:如何在Hadoop MapReduce中设置一个对象作为Map输出的值?如何(在Hadoop中)将数据以正确的类型放入map和reduce函数?

相关内容

  • 没有找到相关文章

最新更新