我想了解关于森林、应用服务器、主机和集群的健康指标的信息,如
- 林中运行状况和磁盘空间警告或警报
- 应用服务器的运行状况。
- 当日志大小超过时发出警告。
- 数据库复制状态。
使用管理API或用作8002监控端口一部分的API,因为我们必须基于该API创建Prometheus端点以将其暴露给grafana。
对于您希望监视的许多事情,可以使用Manage API检索配置和状态,并且可以检索过滤的日志事件。
Manage/v2/logs端点,并指定regex
来过滤相关的日志消息。您可以使用format
参数来检索json
、xml
、html
或text
格式的信息,以更容易解析和处理的格式为准。
- 林中的运行状况和磁盘空间警告或警报https://help.marklogic.com/knowledgebase/article/View/49/16/recovering-from-low-disk-space
您可以通过定期扫描故障迹象来查找故障迹象:
- SVC-FILWRT
- XDMP-MERGESPACE
http://localhost: 8002/管理/v2/日志?文件名= ErrorLog.txt&格式= xml& regex = SVC-FILWRT | XDMP-MERGESPACE
- 应用服务器运行状况。
要执行基本的HealthCheck,可以在每个MarkLogic主机上ping HealthCheck端口7997。例如http://localhost: 7997。这将让您知道MarkLogic进程已启动并在每个主机上运行。
根据您想要跟踪应用服务器运行状况的指标,您可以使用Manage/v2/servers端点来获取请求速率、缓存比率等。
http://localhost: 8002/管理/最近/服务器/app服务?组id = Default& xml视图= status&格式=
- 日志大小超过时发出警告。
没有可配置的日志大小警报。它们每天轮换,并具有可配置的保留策略。
您可能需要通过一些其他方法来监视文件系统的容量,以进行主动监视。
当将日志文件写入与数据文件不同的设备时,可能会耗尽日志记录空间。这似乎不会影响服务器的启动能力,也不会影响森林、数据库或应用程序服务器的可用性。日志条目也将根据配置的操作系统日志级别写入/var/Log/messages。
但是,如果日志挂载已满并且无法写入,则会出现日志事件,您可以通过Manage/v2/logs检索,如上面所示。
- 数据库复制状态。
您指的是数据库及其容灾集群或森林HA副本的状态吗?
为了查看集群的状态,使用Manage/v2/clusters
对于每个数据库,您可以从Manage/v2/databases
中获得林中列表。http://localhost: 8002/管理/最近/数据库/文件?视图= status&格式html =
,并且可以从Manage/v2/forests
验证状态http://localhost: 8002/管理/最近/森林/文档?视图= status&格式html =