以下Hadoop:如何访问(许多)要由map/reduce处理的照片图像?问题,其中orangeoctopus提供了一个合理的方向来加载图像二进制文件,并将它们收集到SequenceFiles
中以向映射器提供信息。
我认为这对其他人也很有用,作为一个本地java进程,或者在大量图像文件的情况下可能是一个hadoop作业,我创建了这个单独的问题来寻找实现的示例。
谢谢!
Hadoop:最终指南-第4章提供了一些读取/写入序列文件的示例。这是相同的代码。浏览代码并将其更改为二进制图像作为序列文件的输入。