当Pod数量高时,Kubernetes仪表板不响应



Kubernetes Dashboard在使用部署计划大量Pod(超过1000个(之前工作良好。

当运行许多Pod时,我在尝试单击仪表板中的任何页面时都会出现以下错误:
Error: 'dial tcp <ip>:9090: getsockopt: connection refused' Trying to reach: 'http://<ip>:9090/api/v1/workload/default?itemsPerPage=10&page=1'

增加主节点的规格有帮助吗?

我认为主节点无法处理网络负载?

更新:
可能是相关的,但我不确定,当我在上运行集群(我使用kops(时,许多中等大小的实例而不是一些非常大的实例,这个问题就减少了(我得到的错误页面更少(
似乎每个节点上的Pod控制器(或您所称的任何节点(都无法处理这么多Pod,因为一个规格非常高的节点上有很多Pod,而中等尺寸的节点上安排的Pod更少。

看起来kubernetes仪表板pod确实缺乏资源。可能的解决方案是在专用节点或资源消耗较少的节点上运行kubernetes dashboard pod。

Taints或Affinity功能可能有助于实现这一点。

最新更新