我想使用datadog的离群值检测来检测不良/故障的AWS实例。那可能吗?我正在尝试使用DataDog创建自动故障转移方案。任何建议都将不胜感激。
您可以使用datadog的离群值检测来识别在同伴集的正常情况之外表现出行为的实例。例如,您可以创建一个异常检测监视器:
http://docs.datadoghq.com/guides/outliers/#alerts
它将范围范围为aws.ec2.cpuutilization
等系统度量,如果与其组相比,任何主机异常尖峰或使用非常低的利用率。
还有一些其他博客文章,讨论了可以在此处找到的算法的使用:
https://www.datadoghq.com/blog/introducing-unlier-detection-indadadog/
https://www.datadoghq.com/blog/outlier-detection-algorithms-at-datadog/
https://www.datadoghq.com/blog/scaling-uplier-algorithms/
也就是说,如果您发现自己需要在离群值检测方面有其他帮助,则可以始终通过support@datadoghq.com与支持团队联系,或使用此处找到的内部支持功能:
https://app.datadoghq.com/help
希望这会有所帮助!