Autosys 中机器挂起和终止状态的警报



我的公司正在运行Autosys r11.1 SP1,作为我们的企业作业调度程序,我发现该产品可以很好地满足其目的。它在我们公司内部享有"复杂"one_answers"不易使用"的声誉;我认为,作为一个跨平台的企业作业调度程序,它肯定会很复杂,当然,掌握这样一个系统的管理需要一些时间和精力。

我不是负责管理的团队的一员,但在我管理我们的数据仓库团队时,我的团队是该产品的最大用户,我正试图准备一些反驳,反对我认为关于该产品局限性的虚假说法。诚然,我知道"Autosys"是一套软件,但我绝非专家。我相信,除了实际的作业调度程序之外,还有一个警报引擎和一个工作负载控制中心,我们已经安装了这三个部分。

目前,如果Autosys作业达到"最大运行警报"状态,将向我们的服务台生成电子邮件警报,他们可以采取适当的行动。根据我对Autosys内部数据模型的理解,这是一个可能发生在工作中的"事件"。

这与我所知的一份工作可以一次属于一座的各种雕像不同;

  1. 已激活
  2. 非活动
  3. 正在启动
  4. 正在运行
  5. 成功
  6. 故障
  7. 挂起
  8. 冰上
  9. 延迟开始
  10. 计算机挂起
  11. 已终止

除了作业遇到最大运行事件时的警报外,我们的服务台还将在作业遇到故障状态或机器挂起状态时收到电子邮件警报。

有人告诉我,如果作业达到"终止状态",它将无法发出警报?我就是不相信。

我还被告知,在发送任何类型的警报之前,都无法过滤作业名称。我们目前没有Autosys的真正开发实例,因此我们使用命名约定来区分生产与UAT或测试,截至目前,我们为所有人生成了电子邮件警报,我们面临着与我们的服务台的不断斗争,试图让他们明白我们不需要为非生产工作创建票证。

如有任何关于该产品真正功能的指导或教育,我们将不胜感激!

Chris

由于我在autosys工作了近3年,据我所知,如果作业进入"终止"(TE)状态,则不会为该作业生成警报。您会收到追逐、最大跑步次数和失败作业的警报。如果将属性设为alarm_if_fail: 0,则在作业失败时将不会收到该作业的警报。

对于您的服务台团队为非生产作业创建的票证,有一个建议:您可以对作业进行轻微更改,通过更改作业名称,让服务台人员意识到这是一个生产作业。例如,如下所示:us_sap_morning_data_p_box。在这里,"P"可以帮助你找到生产工作。类似地,对于cmdfw作业,可以使用以下内容:us_sap_morning_data_p_cmdus_sap_morning_data_p_fw

我不确定这对你有多大帮助。

根据TE事件生成警报的一种方法,特别是绕过那些没有机会在返回代码检查块(或陷阱等)中执行任何代码的框,就是创建警报作业。查看框条件的警报作业(或特定作业)将是发送电子邮件的命令作业。

这种情况看起来有点像

condition: f(name_of_box_or_job) || t(name_of_box_or_job)

最新更新