防止在MapReduce程序中输入分配



我需要输入映射文件。做吗?

1)通常在文件具有.gz扩展名时false。

2)您可以编写自己的输入Format覆盖。

3)不要试图使回报率false。而是将文件大小设置为大于文件大小:

hadoop fs -d fs.local.block.size = 1000000000 -put local_name remote_location

要执行此操作,您需要编写一个自定义输入类,该类别扩展了Enter link Descripts thorefileinputformat,在此类中,您需要覆盖称为Issplittable的方法以返回false。

最新更新