我的数据是csv文件的格式(sam,1,34,there,hello)。我想使用 hadoop 向 csv 文件中的每一行添加一个图像。有没有人对此有任何想法。我见过关于 Hipi 处理图像文件并添加它的信息。但是我想作为列添加到csv文件中。
如果您必须使用 CSV 文件,请考虑对二进制图像数据使用 Base64 编码 - 它将为您提供可打印的字符串。但总的来说,我建议您切换到序列文件,在那里您可以直接以二进制格式存储图像