如何禁用节点自动修复



如何使用terraform禁用GKE集群节点维护自动修复?似乎我无法从GCP控制台停止节点或更改GKE节点的设置。所以我想我将不得不尝试使用terraform,即使它重新创建集群。

维护是如何进行的?我认为它将所有pod迁移到次要节点,然后重新启动第一个节点,对吗?但是,如果辅助节点没有足够的资源来处理来自主节点的所有节点,该怎么办?GCP会创建新节点吗?例如:主节点大约有110个pod,辅助节点有110个pod。如果需要重新启动节点,如何进行维护?

您可以通过在GCP shell中运行以下命令来禁用节点自动修复:

gcloud container node-pools update <pool-name> --cluster <cluster-name> 
--zone compute-zone 
--no-enable-autorepair

您也可以在这个链接中找到如何使用GCP控制台进行操作。

如果您仍然面临问题并希望使用terraform禁用节点自动修复,则必须在参数中指定management,如果您想启用auto-repair。您可以在地形的文档中找到更多详细信息。

您还可以在这里找到节点修复过程的工作原理:

如果GKE检测到某个节点需要修复,则清空该节点并重新创建。GKE等了一个小时,等待引流完成。如果漏排未完成,则关闭节点并创建新节点。

如果有多个节点需要修复,GKE可能并行修复节点。GKE根据集群的大小和损坏节点的数量来平衡修复的数量。GKE将在更大的集群上并行修复更多节点,但随着不健康节点数量的增加,节点数量会减少。

如果在修复过程中的任何时间禁用节点自动修复,则不会取消正在进行的修复,并继续对当前正在修复的任何节点进行修复。

相关内容

  • 没有找到相关文章

最新更新