eksctl 卡在等待节点加入集群上



使用eksctl使用 AWS EKS 创建 Kubernetes 集群时,进程会卡在等待节点加入集群时:

nodegroup "my-cluster" has 0 node(s)
waiting for at least 3 node(s) to become ready in “my-cluster”
timed out (after 25m0s) waiting for at least 3 nodes to join the cluster and become ready in "my-cluster"

将显示该消息,而不显示任何其他日志,直到进程最终超时。看起来在幕后,新创建的节点无法与 Kubernetes 集群通信

使用现有 VPC 网络时,必须确保 VPC 符合所有 EKS 特定要求 [1, 2]。logz.io 的博客文章提供了有关设置 VPC 网络的详细指导,以及可用作基础的示例 AWS 云形成模板 [3]。 缺少 IAM 策略 EKS 工作节点需要 AmazonEKSWorkerNodePolicy 和 AmazonEKS_CNI_Policy 策略 [4] 才能与集群通信。

默认情况下,eksctl 会自动生成包含这些策略的角色。但是,当您使用 "attachPolicyARN" 属性通过 ARN 附加特定策略时,您必须显式包含这些策略 [5]:

nodeGroups:
- name: my-special-nodegroup
iam:
attachPolicyARNs:
- arn:aws:iam::aws:policy/AmazonEKSWorkerNodePolicy
- arn:aws:iam::aws:policy/AmazonEKS_CNI_Policy
- arn:aws:iam::aws:policy/ElasticLoadBalancingFullAccess

[1] https://docs.aws.amazon.com/eks/latest/userguide/create-public-private-vpc.html

[2] https://eksctl.io/usage/vpc-networking

[3] https://logz.io/blog/amazon-eks

[4] https://docs.aws.amazon.com/eks/latest/userguide/worker_node_IAM_role.html

5] https://eksctl.io/usage/iam-policies/

我遇到了同样的问题,并找到了这个问题的真正原因。

问题出在创建的 VPC 上。我还创建了 VPC 和子网,但尚未创建导致问题的路由表和互联网门。

问题得到解决,一旦映射了路由表和互联网网关。

在每个私有和公有子网中添加两个节点组时,我遇到了类似的错误。 在公有子网配置中启用"启用自动分配公有 IPv4 地址"后,此问题已修复。

VPC - 子网 -选择要添加节点组的公有子网 - 编辑子网设置 - 启用上述选项。

最新更新