跟踪使用 HPA 和 CA 在 Kubernetes 中扩展所需的时间



我正在尝试跟踪和监控,一个 pod 需要多少时间才能联机/健康/正在运行。

我正在使用 EKS。我已经在我的集群上安装了 HPA 和集群自动缩放程序。

假设我有一个具有 70%targetAverageUtilization.
HorizontalPodAutoscaler扩展策略的部署,因此,每当部署的平均利用率超过 70% 时,HPA 就会触发以创建新的 POD。现在,根据不同的因素,例如节点是否可用,如果不可用,则需要下载映像或映像是否存在于缓存中,缩放可能需要几秒钟到几分钟才能启动。

我想跟踪这个时间/持续时间,每次安排 POD 时,需要多少时间才能达到Running状态。有什么建议吗?

或者我应该看的任何方向。

我找到了这个集群自动缩放程序可见性日志,但这仅在 GCE 中可用。

我正在寻找任何解决方案,可以是开箱即用的集成,或者引发事件并将其存储在某个时间序列数据库中或从普罗米修斯抓取数据。但是直到现在我都找不到任何解决方案。

提前谢谢。

这没有什么开箱即用的,你需要自己构建一些东西。

最新更新