我在Azure上运行了一个Kubernetes 1.13集群,我正在为多个应用程序使用多个持久卷。我已经设置了Prometheus,Alertmanager,Grafana的监控。
但我无法获得与 PV 相关的任何指标。
似乎 kubelet 开始公开 kubernetes 1.8 中的一些指标,但从 1.12 开始再次停止
我已经与 Azure 团队讨论过直接从实际文件系统(在我的情况下为 Azure 磁盘(收集指标的任何解决方法。但即使这样也是不可能的。
我还听说有些人在 Pod 中使用边车来收集 PV 指标。但我也没有得到任何帮助。
即使我只得到基本细节,如消耗/可用空间,也会很棒。
我遇到了同样的问题,并通过连接两个指标解决了它:
avg(label_replace(
1 - node_filesystem_free_bytes{mountpoint=~".*pvc.*"} / node_filesystem_size_bytes,
"volumename", "$1", "mountpoint", ".*(pvc-[^/]*).*")) by (volumename)
+ on(volumename) group_left(namespace, persistentvolumeclaim)
(0 * kube_persistentvolumeclaim_info)
作为解释,我为每个时间序列添加一个标签volumename
node_filesystem*
,从现有mountpoint
标签中切出,然后与包含其他标签的其他指标联接。乘以 0 可确保否则为无操作。
还有快速警告:我或您可能正在使用一些重新标记的配置,如果不进行调整,这不会立即解决。