通过ITRS Geneos进行Rundeck监控



在Rundeck中设置了各种作业。想要使用ITRS Geneos监测相同情况。我们尝试使用execution和scheduled_execution表编写查询,但scheduled_execution在调度方面有很多差异,例如,对于相同的调度,它也可能有1-5和MON-FRI,这使得它变得困难。

我们要监控的内容:1.是否有执行失败2.是否有作业运行时间超过其平均执行时间3.作业的运行时间是否超过其计划时间,即如果作业计划每5分钟运行一次,那么如果作业运行时间超过5分钟,我们应该得到警告。

请注意-我知道我们可以通过rundeck直接使用电子邮件警报,但希望使用ITRS Geneos,因此寻找一些查询或API参考,这可能会有所帮助。

如果有可用的解决方案,请提出建议。谢谢

为了获得您需要的信息,有一些替代默认电子邮件通知的方法。

您可以在作业定义中设置Webhook Notification,这将把数据POST到Webhook URL。

您可以查询Rundeck的API以收集特定或所有项目的信息,也可以查询特定执行以将查询结果缩小到特定作业。列出执行情况将提供以下信息,您可以将其用于所需的监控目的:

执行失败的[status]执行的[开始日期]和[结束日期]。此外,如果已知,关联作业的平均持续时间将被指示为averageDuration(以毫秒为单位(。

或者,您可以获得有关执行状态的详细信息,该信息将提供有关执行的总体信息,如开始和结束时间以及当前状态,此外,还可以获得节点/工作流步骤级别的更详细信息。

通过API收集的上述信息也可以通过RD CLI收集。

此外,还可以开发创建一个通知插件(在java或groovy中(,用于作业定义,这可以在以下情况下触发:

onstart-作业开始onsuccess-作业已无错误完成onfailure-作业失败或中止onavgduration-执行超过作业的平均持续时间onretryyablefailure-作业失败,但将重试

这是向ITRS或其他监控工具提供信息而不是直接向API/RD CLI查询信息的一个很好的替代方案。

希望这能有所帮助!

相关内容

  • 没有找到相关文章

最新更新