PromQL 查询,用于计算固定日期的服务正常运行时间和停机时间



为了学习普罗米修斯/格拉法纳,我正在尝试构建一个基本的SRE仪表板。

我想计算服务运行的小时数&自今年1月1日以来,它的小时数一直在下降,这样我就可以从错误预算中减少停机时间。可以使用PromQL查询来计算吗?

我更喜欢使用诸如up之类的度量,无论使用什么导出器/客户端库,它都是可用的。

首先,您是在计算普罗米修斯服务的可用性还是普罗米修斯监控的服务的可用度?

如果是第一种情况,则可以使用";向上";度量,如果是第二个度量,则可以使用,例如;probe_success"来自Blackbox出口商的度量。

查看有关";向上";以及";probe_success"不同之处。

点击此处查看更多关于Blackbox出口商的信息。

您可以使用以下查询来计算可用性(以百分比为单位(:

100 * avg_over_time(probe_success{instance="xxxxx"}[1w])

在Grafana中,您可以使用全局变量"$__范围";作为在PromQL中使用仪表板当前时间范围的持续时间([$__range](。

查看Grafana文档中有关全局变量的更多信息。

相关内容

  • 没有找到相关文章