在我们的 Kubernetes 1.6 集群中没有任何已知的更改,所有新的或重新启动的 Pod 都不再被安排。我得到的错误是:
No nodes are available that match all of the following predicates:: MatchInterPodAffinity (10), PodToleratesNodeTaints (2).
我们的集群之前运行良好,我真的看不到在此之前所做的任何配置更改。
我已经尝试过的事情:
- 重新启动主节点
- 重新启动 kube-scheduler
- 删除受影响的 Pod、部署、有状态集
某些容器确实具有以前有效的反关联性设置,但大多数容器没有任何关联性设置。
集群信息:
- Kubernetes 1.6.2
- Kops on AWS 1 个主节点、
- 8 个主节点、1 个污染数据处理节点
这有什么已知的原因吗?
我可以检查哪些设置和日志可以提供更多见解?
是否有可能调试调度程序?
问题是 Pod 卡在删除中。这导致 kube-controller-manager 停止工作。
删除不起作用,因为有问题的 Pod/RS/Deployment 的限制与我们在创建后设置的 maxLimitRequestRatio 冲突。错误报告正在进行中。
解决方案是增加 maxLimitRequestRatio,并最终重新启动 kube-controller-manager。