如果一组节点关闭,普罗米修斯会触发单一警报



我在prometheus服务器上配置了以下目标。所有服务器都配置在Target1.yml文件中,路由器详细信息存储在Router.yml文件。每个站点都有唯一的4位数字,在这个例子中它是"1">1234";。因此,像这样,我们有1000个站点(总共1000个5个节点(*。每当路由器故障或停电时,我们每个站点总共会收到5个警报。

目标1.yml

node1-1234.example.com
node2-1234.example.com
node3-1234.example.com
node1-4567.example.com
node2-4567.example.com
node3-4567.example.com

路由器.yml

router1-1234.example.com
router2-1234.example.com
router1-4567.example.com
router2-4567.example.com

我正在寻找一种解决方案,在停电时只触发路由器警报,忽略node1/node2/node3。你能帮助我如何做到这一点吗?

您可以使用https://github.com/prometheus/blackbox_exporter或https://github.com/czerwonk/ping_exporter

然后根据导出的指标创建警报规则

使用blackbox导出器的prometheus规则示例https://awesome-prometheus-alerts.grep.to/rules#blackbox-1

最新更新