小贝子编程

Spark中的mapreduce参数

本文关键字：参数 mapreduce 中的 Spark hadoop apache-spark hadoop-yarn
更新时间 : 2023-08-27
英文 : mapreduce parameters in Spark

我想知道mapreduce.*参数是否适用于Spark。

据我所知，Spark中没有映射输出的缓冲区，而reduce任务的整个过程也有所不同。像mapreduce.task.io.sort.mb、mapreduce.reduce.shuffle.input.bufferpercent或mapreduce.educe.input.bbuffer.percent这样的参数控制这些类型的缓冲区。我正在优化hadoop/syarn集群中运行的spark任务/作业的参数。

可以肯定地说，这些mapreduce参数无关紧要，我应该只关心spark.*参数既然map、shuffle和reduce部分不同？

这是安全的，因为Spark不使用MapReduce作为处理引擎，但它直接与YARN交互以提交操作。因此，当您使用Spark时，没有安排MapReduce作业，但您有一个Spark应用程序和Spark作业。

最新更新

OAuth2和PKCE - Code验证器无效
GCP 的 CloudSQL - 重新创建现有的只读副本
当解引用指针OCaml时，匹配总是成功的
如何使用cx_Oracle解析oracle过程中的TAB TYPE OUT
如何列出numpy array中的最低值
我如何在脚本中定义tracery来生成随机句子?
如何使用yapf保持参数都在一行?
试图在底部填充溢出
如何使用Matplotlib在圆中绘制未定义数量的随机点
如何在vscode中选择同一个词的所有引用
使用Ansible jinja2 list特性返回的结果比使用Ansible hostvars返回的结果更多
Laravel Eloquent，如何在3个表上访问Eloquent ?
我怎样才能让我的Angular应用允许在生产环境中刷新——重写URL ?
VBS 和 WSH 在简单循环和 CPU 过度使用时出现错误
ComboBox VirtualizingStackPanel WPF Programmatically
如何在使用聚合函数时忽略字符
如何解决多线程静态变量增量?
webpack-streams breaks @types/webpack
为BASH中的单词数组加边框
如何阻止不需要的功能组件被调用?依赖关系在哪里?
列表中字符串字符之间的比较
即使在我执行 commit() 和 autocommit=True 之后，也无法使用 psycopg2 脚本更新 PostgreSQL 表
在x秒后在两个函数之间切换
从对象数组中提取属性，并通过lodash创建基于此属性的另一个?
sectionIndexTitles映射不能正常工作
Apache commons CSVPrinter正在编码双值
coinex交换API，并使用Curl /BASH来放置市场订单加密对
询问直到输入在列表中?
Cant 将 2D 数组传递给函数 C++
如何同步外表和本表?

Spark中的mapreduce参数

相关内容

最新更新

热门标签：