由inputStream过早EOF导致Hadoop MapReduce作业I/O异常

我使用命令hadoop jar <jar> [mainClass] path/to/input path/to/output运行MapReduce程序。然而，我的工作一直挂在:INFO mapreduce.Job: map 100% reduce 29%。

很久以后，我终止并检查datanode日志(我在伪分布式模式下运行)。它包含以下异常:

java.io.IOException: Premature EOF from inputStream
at org.apache.hadoop.io.IOUtils.readFully(IOUtils.java:201)
at org.apache.hadoop.hdfs.protocol.datatransfer.PacketReceiver.doReadFully(PacketReceiver.java:213)
at org.apache.hadoop.hdfs.protocol.datatransfer.PacketReceiver.doRead(PacketReceiver.java:134)
at org.apache.hadoop.hdfs.protocol.datatransfer.PacketReceiver.receiveNextPacket(PacketReceiver.java:109)
at org.apache.hadoop.hdfs.server.datanode.BlockReceiver.receivePacket(BlockReceiver.java:472)
at org.apache.hadoop.hdfs.server.datanode.BlockReceiver.receiveBlock(BlockReceiver.java:849)
at org.apache.hadoop.hdfs.server.datanode.DataXceiver.writeBlock(DataXceiver.java:804)
at org.apache.hadoop.hdfs.protocol.datatransfer.Receiver.opWriteBlock(Receiver.java:137)
at org.apache.hadoop.hdfs.protocol.datatransfer.Receiver.processOp(Receiver.java:74)
at org.apache.hadoop.hdfs.server.datanode.DataXceiver.run(DataXceiver.java:251)
at java.lang.Thread.run(Thread.java:745)

5秒后日志显示为ERROR DataXceiver error processing WRITE_BLOCK operation。

什么问题可能导致这个异常和错误?

我的NodeHealthReport说:

1/1 local-dirs are bad: /home/$USER/hadoop/nm-local-dir; 
1/1 log-dirs are bad: /home/$USER/hadoop-2.7.1/logs/userlogs

我发现这表明dfs.datanode.max.xcievers可能需要增加。然而，它已被弃用，新属性被称为dfs.datanode.max.transfer.threads，默认值为4096。如果更改此值将解决我的问题，我应该将其设置为什么新值?

表示可能需要增加datanode的ulimit。我的ulimit -n(打开的文件)是1024。如果增加这将解决我的问题，我应该把它设置为什么?

过早的EOF可能由于多种原因而发生，其中一个原因是使用FileOutputCommitter在一个reducer节点上生成大量的线程来写入磁盘。MultipleOutputs类允许您使用自定义名称写入文件，为了实现这一点，它为每个文件生成一个线程，并将一个端口绑定到它以写入磁盘。现在，这就限制了在一个reducer节点上可以写入的文件数量。当一个reducer节点上的文件数量大约超过12000时，我遇到了这个错误，因为线程被杀死，_temporary文件夹被删除，导致这些异常消息过多。我的猜测是——这不是内存超调问题，也不能通过允许hadoop引擎生成更多线程来解决。在一个节点上减少一次写入的文件数量解决了我的问题——要么减少实际写入的文件数量，要么增加reducer节点。

相关内容

最新更新

热门标签：