我知道作业任务页面(在 JobTracker UI 中)已经显示了映射器和化简器中每个任务的开始时间和结束时间,但我希望看到更多的东西,比如源机器名称、溢出次数等。我想我可以尝试使用 JobTracker 类编写这样的工具吗?但在开始之前,我想看看是否已经有这样的工具。
hadoop job -history all output-dir
命令是否为您提供了足够的信息来解析/处理?
- http://hadoop.apache.org/common/docs/r1.0.3/cluster_setup.html - 搜索上述命令