Spark的峰值执行内存



在Apache spark UI在阶段级别的指标之一是"峰值执行内存"?

Peak Execution memory 是指在shuffle、aggregation和join过程中创建的内部数据结构所使用的内存。这个累加器的值应该近似于该任务中创建的所有此类数据结构的峰值大小之和。对于SQL作业,这只跟踪所有不安全的操作符、广播连接和外部排序。

您可以使用Tracking spark的内存使用

获得更多关于相同的见解

在SPARK-8735中引入了峰值执行内存度量。这是在缺省情况下启用Tungsten之前,因此它假定spark.sql.unsafe.enabled必须显式地设置为true。

Spark对内存有很多用途:缓存、shuffle、元数据等。对于用户来说,能够深入了解内存密集型操作(如聚合和连接)的内部内存分配是很有用的。我们的目标是在钨和非钨应用中都做到这一点。

也看看SPARK-10144

相关内容

  • 没有找到相关文章

最新更新