我在纱线站点中有一个配置条目.xml如下所示:
<property>
<name>yarn.resourcemanager.am.max-attempts</name>
<value>4</value>
</property>
鉴于以下两种情况,我想问它的真正含义是什么:
比如说,我有一个应用程序管理员,它有一个错误。当我将应用程序提交给 YARN 时,它会尝试启动应用程序大师 5 次然后应用程序失败(我假设错误导致 AM 无法启动(
比如说,我启动了一个纱线应用程序,我手动终止了 ApplicationMaster 进程,应用程序大师会自动重新启动吗? 如果是这样,我再
kill the application - application restarted
4 次,AM 不会再重新启动了吗?
假设 AM 有缺陷并且死了。 或者它有一个内存泄漏,导致它超过它的容器大小并被杀死。 如果它死了 4 次,则应用程序的状态为FAILED
。
所以要回答你的问题,假设你的意思是 4 而不是 5,1 是正确的,2 是正确的。 如果你想了解更多,请查看TestAMRestart.java。