小贝子编程

为什么Hadoop Mapper对数据进行排序

本文关键字：数据排序 Mapper Hadoop hadoop mapreduce
更新时间 : 2023-08-29
英文 : Why does Hadoop Mapper sort data?

我意识到的是，创建一个要发送到化简器的键排序列表是映射器的主要目标。然后，如果列表非常大，则需要在映射器中进行分区，以便它可以由reducer处理(我的意思是对于唯一键，值列表很大，那么需要对其进行分区(，但是为什么Hadoop需要对映射器中的键进行排序。有人问我这个问题，我无法完全说服他。我只是一个初学者，有点好奇.任何帮助，不胜感激。

排序发生在映射器阶段之后和执行化简器作业之前，您不需要显式执行此操作。

请参考类似的问题

最新更新

解决Docker层缓存在Azure Pipeline中不工作的问题
Jetpack compose:可以设置下拉菜单的高度，以显示下一个项目
如何平嵌套的可观察对象，从RXJS
为什么我的解决方案不正确的旅游切片练习?
我如何使用sbt命令，如清洁和编译在我的自定义sbtplugin
Angular语言 - 根据给定的数据自动填充嵌套表单
node-gyp configure将错误:在VisualStudioFinder中生成EPERM
Spring WebClient检索封装在results属性下的json对象
尝试设置BlazorMonaco编辑器时"ReferenceError: monaco is not defined"
Pandas以正确的顺序创建一个列的DataFrame
在clojure中，vector前面的quote是什么意思?
在模板前使用隐式转换
r语言 - 为什么我的生存曲线没有显示为分层分类?
触发通过外部记录创建API提交脚本之前/之后
为什么esp8266客户端没有连接到服务器?
react-native-map-clustering的性能问题
如何在Flutter中设置图像选择器中的图像的最大大小
dotenv:命令在nestjs项目中找不到
测试苗条的动态部件
urllib.error.HTTPError:HTTP错误403:禁止使用urllib.requests
无法写入日志目录- symfony 5
写JSON例如persondata的正确方法是什么?
Django Password Expiry
如何使用python为XML文件中的现有文本添加XML元素
是可能的，如果是这样，是否有一个性能优势，结合最小的API和经典控制器?
如何从本地存储中删除一个多维数组的按钮点击?
反应.Ok总是正确的，即使是故意使用错误的国家
Jenkins zip调试和发布apk，并希望做archiveArtifacts
如何在Oracle XE 21c上下载HR模式?
r语言 - 是否有可能强制一个特定的变量进入bestglm?

为什么Hadoop Mapper对数据进行排序

相关内容

最新更新

热门标签：