没有任何亲和力的 Kubernetes pod 突然停止调度,因为 MatchInterPodAffinity 谓词



在我们的 Kubernetes 1.6 集群中没有任何已知的更改,所有新的或重新启动的 Pod 都不再被安排。我得到的错误是:

No nodes are available that match all of the following predicates:: MatchInterPodAffinity (10), PodToleratesNodeTaints (2).

我们的集群之前运行良好,我真的看不到在此之前所做的任何配置更改。

我已经尝试过的事情:

  • 重新启动主节点
  • 重新启动 kube-scheduler
  • 删除受影响的 Pod、部署、有状态集

某些容器确实具有以前有效的反关联性设置,但大多数容器没有任何关联性设置。

集群信息:

  • Kubernetes 1.6.2
  • Kops on AWS
  • 1 个主节点、
  • 8 个主节点、1 个污染数据处理节点

这有什么已知的原因吗?

我可以检查哪些设置和日志可以提供更多见解?

是否有可能调试调度程序?

问题是 Pod 卡在删除中。这导致 kube-controller-manager 停止工作。

删除不起作用,因为有问题的 Pod/RS/Deployment 的限制与我们在创建后设置的 maxLimitRequestRatio 冲突。错误报告正在进行中。

解决方案是增加 maxLimitRequestRatio,并最终重新启动 kube-controller-manager。

相关内容

最新更新