我的EKS集群遇到了一个奇怪的问题。
在随机间隔,我看到DNS请求在我的集群中为各种pod超时。有时,由于超时,我的pod无法访问rds实例:
dial TCP: lookup myapp.zzzz.eu-west-1.rds.amazonaws.com on 172.20.0.10:53: no such host"
有时我甚至无法解析GitHub url:/
我看到有一个竞争条件的问题,一段时间以前https://github.com/awslabs/amazon-eks-ami/issues/357,但它得到了修复在某个点。我的resolv.conf文件在我的一个pod中看起来像这样:
nameserver 172.20.0.10
search default.svc.cluster.local svc.cluster.local cluster.local eu-west-1.compute.internal
options ndots:5
我使用默认配置的CNI Calico,与CoreDNS相同。我在CoreDNS日志中没有看到任何超时或错误。
eks version: 1.21
ami:amazon-eks-node-1.21-v20210813
你们能告诉我正确的重定向吗?我真的不知道此刻该看哪里
原来是一个印花布bug,为它创建了一个票据https://github.com/projectcalico/calico/issues/4866,"解决方案";是要降级到v3.19.1