如何编写 z/OS 运行状况检查?



我想为 z/OS 写一个健康检查,但不清楚从哪里开始。有什么建议、例子或方向吗?

另外,是否可以在Unix系统服务中编写运行状况检查?

编写一个简单的 REXX 可执行文件,如下所示:

/* REXX Health checker */
say 'Health check passed. System working.'

,然后执行执行。如果您无法执行它或消息未打印,则系统无法正常工作。

但说真的 - 您究竟在检查 z/OS 的哪个部分?您想知道是整个系统出现故障还是只是部分系统关闭?哪些部分 - CICS,MQ,DB2,IMS等批处理作业是否在排队?CICS 交易是否运行太慢?您的 MQ 队列深度是否太大/太小?

这不是一个是/否的问题。从字面上看(我的意思是字面意义上的字面意思)您可以在 z/OS 系统上验证 1,000 多个指标和性能数据 - 它不是一个向上或向下的玩具。

如果您阅读了这篇文章:IBM Health Checker for z/OS 用户指南,您将了解其中涉及的内容。

很多人以前都走过这条路。查找有关CA-Sysview,BMC Mainview,IBM的Omegamon的信息 - 这些都是非常成熟的系统监视器。

我怀疑您正在将大型机视为远程系统,并且您想知道它是否"启动",即它是否会响应您对它提出的任何请求。您能否解释一下您希望它为您做什么,然后我们也许可以根据您的目的设计健康检查。

首先,从 IBM Health Check for z/OS 用户指南开始。 它将指向 SYS1 中的一些示例。SAMPLIB可以用作基础。具体来说,从这里开始。

至于您在Unix系统服务下编写健康检查的问题,这取决于您要做什么。 纯粹在USS之下,没有。 为了进行运行状况检查,您需要向运行状况检查地址空间注册,并以特定方式向其报告状态。 因此,运行状况检查需要用 Metal C、汇编程序或系统 REXX 编写。 (我推荐System REXX,除非你精通Metal C或汇编程序。而且,您需要一个 z/OS 系统程序员将检查安装到系统库中。

但是,如系统 REXX参考中所述,您可以从系统 REXX 调用 USS 服务,我相信 Metal C 和汇编程序也是如此,因此根据您要执行的操作,您可能能够编写您尝试编写的运行状况检查。

Jade,我看到了你的问题,我在网上找到了这份出版物,其中概述了使用 REXX 运行运行状况检查。 它不是USS,但我希望它可能对你有用。

http://ibmsystemsmag.com/mainframe/administrator/systemsmanagement/health_check_rexx/

最新更新