我想获得hdfs上文件的last_modification时间。我检查了HDFS shell指南,但是没有得到任何相关的命令。
Hadoop版本为2.4.0。谁能建议我如何得到hdfs文件的last_modification时间?
thanks in advance
您可以从hadoop ls命令中检索时间戳并使用awk进行解析。文件/目录时间戳有一个模式。对于File,它是
permissions number_of_replicas userid groupid filesize modification_date modification_time filename
目录为
permissions userid groupid modification_date modification_time dirname
文件的第6和第7字段给出修改日期和时间。您可以使用下面的示例来检索这些信息。
hadoop fs -ls /textfile | awk '{timestamp= $6 " " $7;print timestamp}'
请参考ls命令的文档。
http://hadoop.apache.org/docs/r2.7.0/hadoop-project-dist/hadoop-common/FileSystemShell.html