Kubernetes:活动作业在集群升级后被错误地标记为已完成



我有一个正在运行的 kubernetes 集群 (v1.4.6),其活动作业只有一个失败的 pod(例如,它不断重新启动) - 这是一个测试,作业应该永远不会完成。

  • 如果我重新启动同一集群(例如重新启动节点),则作业将正确重新调度并继续重新启动
  • 如果我将集群
  • 升级到 v1.5.3,则在集群启动后,作业将标记为已完成。升级与重启基本相同 - 两者都使用相同的 etcd 集群。

这是转到 v1.5.x 时的预期行为吗?如果没有,可以执行哪些操作才能使作业继续运行? 我应该提供有关我的问题的一些背景 - 工作是最终成为更新过程中的驱动程序,重要的是让它运行(即使面对集群重启),直到它实现某个目标。使用作业可以这样做吗?

在 v1.5.0 中,extensions/v1beta1.Jobs被弃用,取而代之的是batch/v1.Job,因此简单地升级集群而不更新作业定义可能会导致副作用。

请参阅 Kubernetes CHANGELOG 以获取 v1.5.0 中更改和弃用的完整列表。

最新更新