如何处理YARN MapReduce作业的容器故障



如何处理YARN中的软件/硬件故障?具体来说,如果容器发生故障/崩溃会发生什么?

    容器和任务失败由node-manager处理。当一个容器失败或死亡时,node-manager检测到失败事件并启动一个新容器来替换失败的容器,并在新容器中重新启动任务执行。
  • 当application-master出现故障时,资源管理器会检测到故障,并使用新的容器启动application-master的新实例。

点击这里查看详情

    App master将重新尝试异常完成或停止响应的任务(默认4次)有两个以上失败任务的作业被视为失败作业。

相关内容

  • 没有找到相关文章

最新更新