GKE Autopilot 在 10-12 次部署后未能创建新部署,表示"Insufficient CPU"



我对GKE(自动驾驶仪(有一些问题。

我正在部署statefulsets,并且为每个statefulset部署一个具有公共IP的服务。但在部署了10-12个状态集之后,如果我尝试部署任何新的,它将保持红色(不可调度(,并显示消息";cpu不足;。

当我转到集群部分时,会显示一条不同的消息:

Can’t scale up because instances in managed instance groups hosting node pools ran out of IPs

错误图像:https://i.stack.imgur.com/acFxZ.png

我是GKE的新手,并尝试过做那些图片链接中建议的事情,但似乎大多数步骤都会出错,说它在自动驾驶模式下不受支持。

如有任何帮助/建议,我们将不胜感激。

谢谢。

如果您在GKE自动驾驶仪上,理想情况下,如果CPU不足或没有空间调度POD,它将在集群中创建新节点。

然而,如果是IP问题,你可以阅读更多:https://cloud.google.com/kubernetes-engine/docs/how-to/alias-ips#not_enough_space

群集自动缩放器可能没有足够的未分配IP地址空间用于添加新节点或Pod,导致放大失败由eventResult事件指示,并说明原因CCD_ 1。您可以为添加更多IP地址节点,或为添加新的IP地址使用不连续多Pod CIDR的Pod。有关详细信息,请参阅否为Pods提供足够的可用IP空间。

但您处于自动驾驶状态,因此可能无法访问集群的底层子网和节点池。

不幸的是,目前唯一的选择是创建一个新集群,并确保分配给集群的CIDR范围有足够的可用IP来满足您认为需要的节点数量。自动驾驶的默认设置应该足够了。

相关内容

最新更新