为多个服务器/服务实现监视器的最佳方法



我希望创建一个监视器,负责跟踪一堆不同的VM(几乎总是基于ubuntu)。我计划通过发送请求进行测试,以及测试某些服务是否在特定 VM 上运行(这可能需要某种 ssh 组件?此数据将通过 REST API 发送到 cachethq 实例。

我将监控的一些服务包括:Jira,Confluence,Jenkins(和从属节点),以及其他一些Atlassian套件产品。

我正在考虑用python编写一些可以做到这一点的东西。有没有人有其他更好的建议?

谢谢

假设您设置了执行所描述的所有监视的监视服务器。然后您的监控服务器将脱机。你怎么会知道?

解决这个递归监视问题将花费比您估计的更多的时间,这就是为什么构建自己的监视解决方案几乎毫无意义的原因。

我会使用便宜的灵活正常运行时间监视器(我偏向于 https://wdt.io),在 VM 上设置 cron 作业来测试您的服务,然后在正常运行时间监视器上卷曲一个唯一的 URL。如果服务关闭,则不会发生卷曲,监视器会提醒您。

那些带有 Web GUI 的服务,您可以通过定期 ping 相应的 URL 来直接使用正常运行时间监视器进行监控。

根据我的经验,我认为有必要进行内部虚拟机监控(监控应用程序,端口状态,主机活动,CPU,RAM...),以及通过用户体验(硒)和远程检查进行外部监控。所有这些信息都可以通过脚本或远程执行提取,但是当有应用程序为我们提供所有这些时,我们为什么要处理它呢?您可以找到社区应用程序,如Pandora FMS(http://pandorafms.org/en/features/monitoring-software/)与软件可用的代理,通过它可以自动提取所有系统信息,并通过简单的命令获取Jira,Confuence...地位。它还允许您向所有这些虚拟机添加自定义脚本和远程检查...看看吧

Nagios是一个灵活且可扩展的基础设施监控工具。它允许您编写自己的脚本来检查您需要检查的任何内容。

https://www.nagios.org/

我相信有一个带有UI的付费版本,但您可以免费获得IIRC的基本版本。

最新更新