显示每个映射器和化简器的完成时间和源计算机名称的细分的工具



我知道作业任务页面(在 JobTracker UI 中)已经显示了映射器和化简器中每个任务的开始时间和结束时间,但我希望看到更多的东西,比如源机器名称、溢出次数等。我想我可以尝试使用 JobTracker 类编写这样的工具吗?但在开始之前,我想看看是否已经有这样的工具。

hadoop job -history all output-dir 命令是否为您提供了足够的信息来解析/处理?

  • http://hadoop.apache.org/common/docs/r1.0.3/cluster_setup.html - 搜索上述命令

最新更新