我刚刚从1.15更新到1.16,我无法在我的命名空间中启动和运行我的部署。当我尝试着去列出我的pod时,它们都陷入了CrashLoopBackOff状态。我试着描述一个pod,下面是我在events部分得到的结果
Events:
Type Reason Age From Message
---- ------ ---- ---- -------
Normal Pulling 56m (x8 over 72m) kubelet Pulling image "xxxxxxx.dkr.ecr.us-west-2.amazonaws.com/xxx-xxxx-xxxx:master.697.7af45fff8e0"
Warning BackOff 75s (x299 over 66m) kubelet Back-off restarting failed container
kubertets version -
Client Version: version.Info{Major:"1", Minor:"20", GitVersion:"v1.20.5", GitCommit:"6b1d87acf3c8253c123756b9e61dac642678305f", GitTreeState:"clean", BuildDate:"2021-03-18T01:10:43Z", GoVersion:"go1.15.8", Compiler:"gc", Platform:"linux/amd64"}
Server Version: version.Info{Major:"1", Minor:"16+", GitVersion:"v1.16.15-eks-e1a842", GitCommit:"e1a8424098604fa0ad8dd7b314b18d979c5c54dc", GitTreeState:"clean", BuildDate:"2021-07-31T01:19:13Z", GoVersion:"go1.13.15", Compiler:"gc", Platform:"linux/amd64"}
似乎你的容器是卡在图像拉状态,这里有一些东西,你可以检查。
- 确保ECR中存在图像
- 确保EKS集群能够连接到ECR -如果它是一个私有回购,它将需要凭证。
- 运行docker pull,看看它是否能够直接拉出它(很可能会失败,或者如果还没有通过,会要求凭据)
所以问题是我试图在ARM节点实例上部署x86容器。当我为我的节点组
更改启动模板图像后,一切都工作了