显示指定日期在HDFS上创建的hadoop文件



我想在特定日期创建的特定文件夹下显示HDFS上的hadoop文件,是否有命令/选项可以这样做?

提前感谢,林

据我所知,hadoop命令不支持此操作。

您可以编写一个脚本来实现这一点,这不是一个很好的实现。

我的建议

  1. 以更方便使用的方式组织您的文件。在你的情况下,做一个time partition会更好。
  2. 如果您想使数据分析更容易,可以使用hivehdfs基础上的databasehive支持partitionsql的查询和插入。

hivehive partitions的更多信息:
https://hive.apache.org/https://cwiki.apache.org/confluence/display/Hive/LanguageManual + DDL # LanguageManualDDL-PartitionedTables

最新更新