在我目前看到的所有示例中,mapreduce应用程序都将文本文件作为输入,并将文本作为输出。
我希望我的应用程序从二进制文件中读取对象,并将对象写回输出文件。
在MapReduce中最好的方法是什么?
我正在用java编写应用程序
SequenceFile为二进制键值对提供了一个持久的数据结构。你可以在下面的网址找到更多的信息。
http://wiki.apache.org/hadoop/SequenceFile http://hadoop.apache.org/common/docs/current/api/org/apache/hadoop/io/SequenceFile.html