为多个服务器/服务实现监视器的最佳方法

我希望创建一个监视器，负责跟踪一堆不同的VM（几乎总是基于ubuntu）。我计划通过发送请求进行测试，以及测试某些服务是否在特定 VM 上运行（这可能需要某种 ssh 组件？此数据将通过 REST API 发送到 cachethq 实例。

我将监控的一些服务包括：Jira，Confluence，Jenkins（和从属节点），以及其他一些Atlassian套件产品。

我正在考虑用python编写一些可以做到这一点的东西。有没有人有其他更好的建议？

谢谢

假设您设置了执行所描述的所有监视的监视服务器。然后您的监控服务器将脱机。你怎么会知道？

解决这个递归监视问题将花费比您估计的更多的时间，这就是为什么构建自己的监视解决方案几乎毫无意义的原因。

我会使用便宜的灵活正常运行时间监视器（我偏向于 https://wdt.io），在 VM 上设置 cron 作业来测试您的服务，然后在正常运行时间监视器上卷曲一个唯一的 URL。如果服务关闭，则不会发生卷曲，监视器会提醒您。

那些带有 Web GUI 的服务，您可以通过定期 ping 相应的 URL 来直接使用正常运行时间监视器进行监控。

根据我的经验，我认为有必要进行内部虚拟机监控（监控应用程序，端口状态，主机活动，CPU，RAM...），以及通过用户体验（硒）和远程检查进行外部监控。所有这些信息都可以通过脚本或远程执行提取，但是当有应用程序为我们提供所有这些时，我们为什么要处理它呢？您可以找到社区应用程序，如Pandora FMS（http://pandorafms.org/en/features/monitoring-software/）与软件可用的代理，通过它可以自动提取所有系统信息，并通过简单的命令获取Jira，Confuence...地位。它还允许您向所有这些虚拟机添加自定义脚本和远程检查...看看吧

Nagios是一个灵活且可扩展的基础设施监控工具。它允许您编写自己的脚本来检查您需要检查的任何内容。

https://www.nagios.org/

我相信有一个带有UI的付费版本，但您可以免费获得IIRC的基本版本。

相关内容

最新更新

热门标签：