运行kubernetes集群的虚拟机会定期停机



我们正在几百个虚拟机上运行几个kubernetes集群。每周都会有一些虚拟机宕机。我们把它拿回来。我们的指标显示;当这些虚拟机停机时,它们的内存使用率从低到中等。其他VM指标(如网络流量(也没有指向任何异常模式。当虚拟机停机时,/var/log/messages中没有特定的消息。

Kubernetes版本:1.9Linux内核版本:4.1.12-124.19.5.el7uek.x86_64

我们是否可以检查其他日志或诊断信息,以找出VM停机的根本原因。

通常我们也会检查主机日志,尤其是当您将kubelet作为systemd运行时
有一个关于digitalocean解释日志的好教程。

https://www.digitalocean.com/community/tutorials/how-to-use-journalctl-to-view-and-manipulate-systemd-logs

它可能会给你一些线索,告诉你为什么你的kube节点崩溃。

最新更新