重新启动节点后,由于编织IP不足,豆荚粘在容器创建状态下



我在1.11上使用2.5.1版的Kubeadm和Weave(CNI(运行的1.11上有3个节点kubernetes群集。我提供的IP范围为128 IP的编织CIDR。两次重新启动节点后,一些吊塞在containerCreating状态下的豆荚。

运行kubectl describe pod <pod_name>后,您将看到以下错误:

Events:
Type     Reason                  Age                From                Message
----     ------                  ----               ----                
-------
Normal   SandboxChanged          20m (x20 over 1h)  kubelet, 10.0.1.63  Pod sandbox changed, it will be killed and re-created.
Warning  FailedCreatePodSandBox  30s (x25 over 1h)  kubelet, 10.0.1.63  Failed create pod sandbox: rpc error: code = DeadlineExceeded desc = context deadline exceeded

如果我检查运行多少个容器以及分配了多少个IP地址,我可以看到24个容器:

[root@ip-10-0-1-63 centos]# weave ps | wc -l
26

在该节点上编织的总IP数为42。

[root@ip-10-0-1-212 centos]# kubectl exec -n kube-system -it weave-net-6x4cp -- /home/weave/weave --local status ipam
Defaulting container name to weave.
Use 'kubectl describe pod/weave-net-6x4cp -n kube-system' to see all of the containers in this pod.
6e:0d:f3:d7:f5:49(10.0.1.63)                42 IPs (32.8% of total) (42 active)
7a:24:6f:3c:1b:be(10.0.1.212)               40 IPs (31.2% of total) 
ee:00:d4:9f:9d:79(10.0.1.43)                46 IPs (35.9% of total) 

您可以看到所有42个IP都处于活动状态,因此没有更多的IP可以分配给新容器。但是,实际上只有42个只有26个分配给容器,我不确定剩下的IP在哪里。它正在所有三个节点上发生。

这是您参考的编织状态的输出:

[root@ip-10-0-1-212 centos]# weave status
    Version: 2.5.1 (version 2.5.2 available - please upgrade!)
    Service: router
    Protocol: weave 1..2
       Name: 7a:24:6f:3c:1b:be(10.0.1.212)
    Encryption: disabled
PeerDiscovery: enabled
    Targets: 3
Connections: 3 (2 established, 1 failed)
      Peers: 3 (with 6 established connections)
TrustedSubnets: none
    Service: ipam
     Status: waiting for IP(s) to become available
      Range: 192.168.13.0/25
DefaultSubnet: 192.168.13.0/25

如果您需要更多信息,我很乐意提供。任何线索?

不确定我们是否有同样的问题。但是在我重新启动节点之前。我需要先drain。因此,该节点中的所有豆荚都将被驱逐。我们可以安全地重新启动节点。该节点启动之后。您需要再次uncordon。该节点将可以再次安排POD。

我的参考https://kubernetes.io/docs/tasks/administers-cluster/safely-drain-node/

我猜想16个IP已保留用于PODS重用目的。这些是基于CIDR范围的每个节点的最大POD。

  Maximum Pods per Node CIDR Range per Node
  8                     /28
  9 to 16               /27
  17 to 32              /26
  33 to 64              /25
  65 to 110             /24

如果您编织IP耗尽,并且某些IP在重新启动后未发布。您可以删除文件/var/lib/weave/weave-netdata.db并重新启动编织吊舱。

对于我的情况,我添加了一个SystemD脚本,该脚本在系统的每次重启或关闭中都删除了/var/lib/weave/weave-netdata.db文件,并且一旦系统出现,它将新IP分配给所有PODS,并且从未再次看到Weave IP排气。<<<<<<<<<<<<<<<<<<<<<<<<<<<<

在此处发布此信息,希望别人会发现它对他们的用例很有用。

相关内容

  • 没有找到相关文章

最新更新