GCE在创建的度量之一不存在时发出警报(通过地形)



我已经通过terraform配置了警报策略,其中包括CPU/Memory和其他警报(其中许多(。不幸的是,当我的一个GCE实例没有响应时,我遇到了一个问题——我在Slack中收到了很多警报,因为我为所有策略配置了condition_absent块。

例如:

condition_absent {
duration = "360s"
filter   = "metric.type="custom.googleapis.com/quota/gce" resource.type="global""
aggregations {
alignment_period     = "60s"
cross_series_reducer = "REDUCE_SUM"
group_by_fields = [
"metric.label.metric",
"metric.label.region",
]
per_series_aligner = "ALIGN_MEAN"
}
condition_absent {
duration = "360s"
filter          = "metric.type="agent.googleapis.com/memory/percent_used" resource.type="gce_instance" metric.label."state"="used""
aggregations {
alignment_period     = "60s"
cross_series_reducer = "REDUCE_SUM"
per_series_aligner = "ALIGN_MEAN"
}

我的问题是:如果其中一个度量停止工作,我可以在地形中创建一个condition_absent块而不是多个,并发送一个通知而不是吨吗?

我已通过添加监控代理正常运行时间度量警报来解决此问题。当虚拟机无法访问(过载等(时,它会正确显示

最新更新