假设我有配置单元作业中的临时文件名,并且在给定的时间有多个作业在执行,是否可以确定哪个配置单元作业生成了所选文件?它记录在什么地方了吗?
http://jobtrackerhost:50030/jobtracker.jsp.
中提供了有关正在运行和过去作业的信息
进入与作业详细信息的链接,还有到作业文件的链接,其中显示了有关hdfs /tmp/hive-${username}
mapred.cache.files
中使用的文件名称的信息。
此信息也可在$HADOOP_HOME/mr1/logs/
文件中的xml文件中获得:*conf.xml