Hadoop:生成带有要在map/reduce中处理的图像二进制文件的SequenceFile的示例过程



以下Hadoop:如何访问(许多)要由map/reduce处理的照片图像?问题,其中orangeoctopus提供了一个合理的方向来加载图像二进制文件,并将它们收集到SequenceFiles中以向映射器提供信息。

我认为这对其他人也很有用,作为一个本地java进程,或者在大量图像文件的情况下可能是一个hadoop作业,我创建了这个单独的问题来寻找实现的示例。

谢谢!

Hadoop:最终指南-第4章提供了一些读取/写入序列文件的示例。这是相同的代码。浏览代码并将其更改为二进制图像作为序列文件的输入。

最新更新