我在prometheus服务器上配置了以下目标。所有服务器都配置在Target1.yml文件中,路由器详细信息存储在Router.yml文件。每个站点都有唯一的4位数字,在这个例子中它是"1">1234";。因此,像这样,我们有1000个站点(总共1000个5个节点(*。每当路由器故障或停电时,我们每个站点总共会收到5个警报。
目标1.yml:
node1-1234.example.com
node2-1234.example.com
node3-1234.example.com
node1-4567.example.com
node2-4567.example.com
node3-4567.example.com
路由器.yml:
router1-1234.example.com
router2-1234.example.com
router1-4567.example.com
router2-4567.example.com
我正在寻找一种解决方案,在停电时只触发路由器警报,忽略node1/node2/node3。你能帮助我如何做到这一点吗?
您可以使用https://github.com/prometheus/blackbox_exporter或https://github.com/czerwonk/ping_exporter
然后根据导出的指标创建警报规则
使用blackbox导出器的prometheus规则示例https://awesome-prometheus-alerts.grep.to/rules#blackbox-1