小贝子编程

Hadoop总是在节点之间均匀地分配工作吗?

本文关键字：分配工作节点之间 Hadoop hadoop mapreduce hdfs job-scheduling mappers
更新时间 : 2023-08-23
英文 : Will Hadoop always spread the work evenly between nodes?

假设我有200个输入文件和20个节点，每个节点有10个映射器槽。Hadoop是否总是均匀地分配工作，这样每个节点将获得10个输入文件并同时启动10个映射器?有没有办法强迫这种行为?

使用多少映射器取决于输入—特别是输入分割。在您的例子中，200个文件可以提供给200个映射器。但真正的答案要复杂一些。这取决于

文件大小:如果文件大于块大小，则块大小的块被发送到映射器
是可分割的文件。例如，gzip压缩文件不能被分割。一个完整的文件到一个映射器(即使文件比块大小大)

最新更新

R函数转换为HTML
裸机中的 Kubernetes 证书管理器问题：等待 HTTP-01 质询传播：状态代码"403"错误，预期'200'
使用钩子将状态从一个组件传递到另一个组件(不是子组件)
当我们使用暂存标志(--暂存)进行"npm build"时，如何在应用程序中创建"NON PRODUCTION"横幅？
循环访问列表，为每个项目创建新列表，然后将新列表作为参数传递给函数，但"var referenced before assignment"
React单元测试Jest使用Typescript mount()的问题
是否有一种方法来隐藏代码使用Swift包管理器?
如何限制游戏循环fps?
Django将更复杂的python类型传递给模板
r语言 - 创建可使用元素访问的响应值列表
ECharts Apache:条形图-添加水平水平线
aws Cloudfront的维护页面
是否有任何方法为我的php应用程序从计算机到整个互联网?
根据指定值计算集合中所有可能的值组合
如何将Django模型限制为单个一对一关系?
尽管有"max-size"命令，但 docker-compose 未轮换失控的 docker 日志
使用元组作为索引来比较列表中的项
如何修复"javax.crypto.IllegalBlockSizeException: Input length must be multiple of 16 when decrypting wit
c -使用中断或线程和全局变量进行优化
Html语言中带有fetch方法的Onclick回调
如何调试SQL Server 2018中的存储过程
如何修复我的代码从serial1接收数据并按下一个值并将其发送到serial0，同时运行步进电机 &
CentOS安装R包RLumShiny失败
解析字符串以创建几何图形
restorePreviousSignIn()在GIDSignIn-iOS SDK V6.0.2到期时不获取新的idTo
从Nodejs发送的错误请求-原始消息缺少头部信息
Oracle 将今天的值传递给变量并使用它
r语言 - 是否有可能把3D网格和arc3d对象在同一个rgl窗口，同时允许单独旋转?
依次递增的号码，如123 + 123 = 123123
SQL:如何使用参数变量重命名标题?

Hadoop总是在节点之间均匀地分配工作吗?

相关内容

最新更新

热门标签：