DataStage 版本是 8.1 - 我没有直接访问权限,但需要给出说明来为我提取一些作业运行时统计信息。我相信存储库在 DB2 数据库中,或者如果在 8.1 中仍然支持,则可能在平面文件中。我无法在那里安装任何工具。
有一个主序列,只有几十个作业。其中一些是平行的。序列本身一次运行一个,并且在白天不断运行。
在 24 小时内,我需要提取此主序列的性能统计信息。像这样:
job_name, start_time, finish_time, completion_status
我真的只需要计时信息。我可以使用任何格式,但最终我真正想要的是一个 csv 风格的文件,其时间如上所述。
我在 dsjob -report 上得到了一些提示,但我在 DataStage 中没有足够的背景来提供良好的说明。希望自己能访问,但同样,我是 DataStage 的菜鸟。
提前谢谢。
您可以将作业上次运行的元数据导出到 XML 文件。
#!/usr/bin/ksh
project="yourProjectName"
job="yourJobName"
dsjob -report $project $job XML >"$project_$job.xml"
您可以使用 Director 导出序列日志,并在作业启动和完成时进行分析。或者,您可以通过命令行导出日志(请参阅 dsjob -logsum 命令),然后在 awk 中进行解析(如果在 UNIX 或 AIX 系统上)。
如果您能够修改序列,则可以添加活动阶段,并在序列中的作业之前和之后写入文件。