我正在编写一个hadoop作业,它应该收集集群中运行的所有作业的开始和结束时间,并将这些数据上传到blob。然而,我不确定如何获得这些信息,因为工作似乎无法访问工作跟踪器。有什么想法吗?
您可以使用JobInProgress类提供的getLaunchTime()和getFinishTime()方法。API还有一个JobTracker类,它提供getJobsFromQueue(字符串队列)方法,可用于获取提交到特定队列的所有作业。
除了这些方法之外,这些类还有一些其他非常有用的方法,您可能会发现这些方法很有用。
HTH