小贝子编程

计算密集型工作应该在哪里进行?Hadoop MapReduce 中的映射器方法或化简器方法

本文关键字：方法映射 MapReduce Hadoop 工作密集型在哪里计算 java hadoop mapreduce mapper
更新时间 : 2023-08-29
英文 : Where should computationally intensive work should be done? Mapper Method or Reducer Method in Hadoop MapReduce

我正在处理大型文本文件。每条记录都是输入文本文件中的一行，我正在这些记录中搜索某些关键字。
我想知道在Hadoop MapReduce中工作时，以下两种方法中的哪一种会更有效（时间复杂度）：

请帮忙！

两者都应该没问题，但是，根据您的输入，我将在 map 函数中尝试它，因为：

只有找到关键字，数据才会发送到组和归约阶段。如果与您的关键字匹配的数据较少，则分组和缩减的开销会显着减少。

相关内容