GKE 的集群自动缩放器卡在初始化状态



我最近在优化集群(GKE(利用率,两天前我注意到我的节点没有按比例放大或缩小。自动缩放配置映射处于初始化模式:

kubectl describe -n kube-system configmap cluster-autoscaler-status
Name:         cluster-autoscaler-status
Namespace:    kube-system
Labels:       <none>
Annotations:  cluster-autoscaler.kubernetes.io/last-updated: 2020-04-29 14:44:54.363091383 +0000 UTC
Data
====
status:
----
Cluster-autoscaler status at 2020-04-29 14:44:54.363091383 +0000 UTC:
Initializing
Events:  <none>

其他集群包含适当的自动缩放事件。我想我可以用pod的数量来重载集群。它包含约100个吊舱/节点。

更新1:

  1. 什么GKE版本在master上运行?:1.14.10-gke.27,但我认为升级到1.15.11-gke.9会有所帮助(并且会以某种方式掌握(。这没用。我们还有其他具有相同版本和池的集群
  2. 它发生在任何节点池中,还是发生在特定的节点池中?:自动缩放配置映射有点像;"全球水平";,因此所有节点池都受到影响
  3. 你能提供游泳池的大小、gke版本和自动缩放设置吗
default  OK 1.14.10-gke.27  4 (2 per zone) custom-8-45056   Container-Optimized OS (cos)    0 - 8 nodes per zone    
preemptible8-2   OK 1.14.10-gke.27  10 (5 per zone) n1-standard-8   Container-Optimized OS (cos)    0 - 20 nodes per zone   
scalability-stable-2-cpu     OK 1.14.10-gke.27 1 (0 - 1 per zone) n1-standard-2 Container-Optimized OS (cos)    0 - 4 nodes per zone

附加信息:

  1. 当它关闭自动缩放并在每个节点池中打开时,kubectl describe -n kube-system configmap cluster-autoscaler-status has changed的输出
  2. 当我更改:scalability-table-2-cpu的设置时,我认为这可能会发生

3天后恢复正常。

最新更新