为什么我的kubernetes每天22:00都会删除NotReady状态的工作节点



我们公司在阿里云上有一个kubernetes集群,版本是v1.14.0。我发现每天22:00,处于"未就绪"状态的工作节点将从集群中删除。起初我认为这是因为我们在集群中部署了集群自动缩放器,所以我检查了它的配置,但没有发现任何配置会自动删除集群中的节点。我们的集群自动缩放器的信息如下所示。

Images:registry.cn-hangzhou.aliyuncs.com/acs/autoscaler:v1.3.1-be4edda
command:
- command:
- ./cluster-autoscaler
- --v=5
- --stderrthreshold=info
- --cloud-provider=alicloud
- --scan-interval=10s
- --scale-down-delay-after-add=10m
- --scale-down-delay-after-failure=1m
- --scale-down-unready-time=1m
- --ok-total-unready-count=1000
- --max-empty-bulk-delete=50
- --expander=least-waste
- --leader-elect=false
- --scale-down-unneeded-time=10m
- --scale-down-utilization-threshold=0.05
- --scale-down-gpu-utilization-threshold=0.3
- --skip-nodes-with-local-storage=false
- --nodes=0:100:private_information

如有任何帮助,我们将不胜感激。

问题已解决。有人设置了一个crontab任务来清理NotReady状态节点。

最新更新