提取数据阶段作业性能统计信息(开始和完成时间)



DataStage 版本是 8.1 - 我没有直接访问权限,但需要给出说明来为我提取一些作业运行时统计信息。我相信存储库在 DB2 数据库中,或者如果在 8.1 中仍然支持,则可能在平面文件中。我无法在那里安装任何工具。

有一个主序列,只有几十个作业。其中一些是平行的。序列本身一次运行一个,并且在白天不断运行。

在 24 小时内,我需要提取此主序列的性能统计信息。像这样:

job_name, start_time, finish_time, completion_status

我真的只需要计时信息。我可以使用任何格式,但最终我真正想要的是一个 csv 风格的文件,其时间如上所述。

我在 dsjob -report 上得到了一些提示,但我在 DataStage 中没有足够的背景来提供良好的说明。希望自己能访问,但同样,我是 DataStage 的菜鸟。

提前谢谢。

您可以将作业上次运行的元数据导出到 XML 文件。

#!/usr/bin/ksh
project="yourProjectName"
job="yourJobName"
dsjob -report $project $job XML >"$project_$job.xml"

您可以使用 Director 导出序列日志,并在作业启动和完成时进行分析。或者,您可以通过命令行导出日志(请参阅 dsjob -logsum 命令),然后在 awk 中进行解析(如果在 UNIX 或 AIX 系统上)。

如果您能够修改序列,则可以添加活动阶段,并在序列中的作业之前和之后写入文件。

相关内容

最新更新