小贝子编程

在Hadoop中，化简器在随机阶段将其输入复制到何处

本文关键字：何处复制 Hadoop 随机 hadoop mapreduce
更新时间 : 2023-08-29
英文 : In Hadoop, Where does the reducer copy its input during the shuffle phase

在Hadoop中，映射器的输出在随机阶段被复制到化简器。化简器必须从不同的映射器复制其相应的分区。在开始实际的减速过程之前，减速器将其输入存储在哪里？

映射输出被复制到归约任务 JVM 的内存中，如果它们是足够小(缓冲区的大小由 mapred.job.shuffle.input.buffer.percent，指定用于此目的的堆的比例(;否则，它们是复制到磁盘。当内存中缓冲区达到阈值大小时 (由mapred.job.shuffle.merge.percent控制(或达到映射输出的阈值数(mapred.inmem.merge.threshold(，它是合并并溢出到磁盘。如果指定了合并器，它将运行在合并期间减少写入磁盘的数据量。

参考 - Hadoop 权威指南

相关内容

没有找到相关文章

最新更新