我已经设置了statsd-exporter来从gunicorn Web服务器抓取指标。我的目标是仅为成功请求(非 5xx(过滤请求持续时间指标,但是在 statsd-exporter 中,无法在持续时间指标中标记状态代码。任何人都可以建议一种在请求持续时间指标中添加状态代码的方法,或者一种在普罗米修斯中仅过滤成功请求持续时间的方法。
特别是我想从 statsd 导出器中提取成功的请求持续时间 hitogram 到普罗米修斯。
要将成功的请求持续时间直方图指标从 Gunicorn Web 服务器导出到 Prometheus,您需要在 Gunicorn Sorcecode 中添加此功能。
首先,请在此处查看导出 statsd 指标的代码。 您应该看到代码的平静:
status = resp.status
...
self.histogram("gunicorn.request.duration", duration_in_ms)
通过将代码更改为 sth,如下所示:
self.histogram("gunicorn.request.duration.%d" % status, duration_in_ms)
从这一刻起,您将导出带有状态代码(如gunicorn_request_duration_200
或gunicorn_request_duration_404
等(的指标名称。
您还可以稍微修改一下,并通过将如下所示的配置移动到标签statsd_exporter
:
mappings:
- match: gunicorn.request.duration.*
name: "gunicorn_http_request_duration"
labels:
status: "$1"
job: "gunicorn_request_duration"
因此,您的指标现在将如下所示:
# HELP gunicorn_http_request_duration Metric autogenerated by statsd_exporter.
# TYPE gunicorn_http_request_duration summary
gunicorn_http_request_duration{job="gunicorn_request_duration",status="200",quantile="0.5"} 2.4610000000000002e-06
gunicorn_http_request_duration{job="gunicorn_request_duration",status="200",quantile="0.9"} 2.4610000000000002e-06
gunicorn_http_request_duration{job="gunicorn_request_duration",status="200",quantile="0.99"} 2.4610000000000002e-06
gunicorn_http_request_duration_sum{job="gunicorn_request_duration",status="200"} 2.4610000000000002e-06
gunicorn_http_request_duration_count{job="gunicorn_request_duration",status="200"} 1
gunicorn_http_request_duration{job="gunicorn_request_duration",status="404",quantile="0.5"} 3.056e-06
gunicorn_http_request_duration{job="gunicorn_request_duration",status="404",quantile="0.9"} 3.056e-06
gunicorn_http_request_duration{job="gunicorn_request_duration",status="404",quantile="0.99"} 3.056e-06
gunicorn_http_request_duration_sum{job="gunicorn_request_duration",status="404"} 3.056e-06
gunicorn_http_request_duration_count{job="gunicorn_request_duration",status="404"} 1
现在要查询除普罗米修斯中状态为 5xx 的指标之外的所有指标,您可以运行:
gunicorn_http_request_duration{status=~"[^5].*"}
让我知道它是否有帮助。