我有许多服务器被心跳ping。我想弄清楚该怎么做的是:
"观察程序 1"每分钟运行一次 - 当服务器持续关闭一分钟(无监视器.status = 过去 60 秒文档检测信号中某个特定地址的任何文档已启动(时,发送电子邮件通知,然后触发"观察程序"每 24 小时再次评估一次。
-
"Watcher 2" - 在 24 小时标记处,如果服务器仍持续关闭(对于过去 24 小时内为该服务器返回的任何检测信号文档中 ping 到的该地址的任何文档,没有 monitor.status = up(,则触发另一封电子邮件。
-
在此"等待 24 小时"期间,暂停服务器上每分钟运行的"观察程序 1">
观察程序/警报功能(无需自定义(是否可行?我之前看过关于 简单的停机时间通知,但不确定是否可以执行其余操作。
我认为您应该在观察者中查看限制选项。根据 Elasticsearch 文档
在监视执行期间,一旦满足条件,就会做出决策 根据配置的操作决定是否应限制它。这 操作限制的主要目的是防止过多的执行 同一手表的相同操作。
"actions" : {
"email_administrator" : {
"throttle_period": "24h",
"email" : {
"to" : "sys.admino@host.domain",
"subject" : "Encountered {{ctx.payload.hits.total}} errors",
"body" : "Too many error in the system, see attached data",
"attachments" : {
"attached_data" : {
"data" : {
"format" : "json"
}
}
},
"priority" : "high"
}
}