我想在特定日期创建的特定文件夹下显示HDFS上的hadoop文件,是否有命令/选项可以这样做?
提前感谢,林
据我所知,hadoop
命令不支持此操作。
您可以编写一个脚本来实现这一点,这不是一个很好的实现。
我的建议
- 以更方便使用的方式组织您的文件。在你的情况下,做一个
time partition
会更好。 - 如果您想使数据分析更容易,可以使用
hive
等hdfs
基础上的database
。hive
支持partition
和sql
的查询和插入。
hive
和hive partitions
的更多信息:
https://hive.apache.org/https://cwiki.apache.org/confluence/display/Hive/LanguageManual + DDL # LanguageManualDDL-PartitionedTables