格拉法纳提醒普罗米修斯/Pushgateway是否有旧数据



我有几个客户将他们的度量推送到Pushgateway,然后被Prometheus刮走。最后,我将Grafana用于仪表板——我想这不是一个太奇特的设置。

令我困惑的是,当其中一个客户停止工作,不再推送其指标时,Pushgateway将进一步向Prometheus提供它收到的最后一个值,Grafana将很高兴地显示一条水平线。

然而,如果指标太旧,我更希望收到警报。如何做到这一点?

Prometheus用time((提供当前时间,该时间提供自1970年1月1日UTC以来的秒数。Pushgateway为每个作业保留一个度量:push_time_seconds,它显示自1970年1月1日UTC以来最后一次推送的时间(以秒为单位(。

所以查询

time() - push_time_seconds

将显示您拥有的每个导出作业的年龄(以秒为单位(。现在,如果该值超过定义的阈值,则可以很容易地进行进一步的过滤和报警。对于预计每天运行一次的工作(因此他们的指标预计永远不会超过24小时(,我在Grafana中将阈值设置为25小时(90000秒(,这很有魅力。

最新更新