使用bash在hdfs中递归查找zip文件



如何使用bash递归地在hdfs目录中查找.zip文件。

我尝试过的:

hdfs dfs -ls -R /path/to/directory | grep *.zip

但是这个命令不会列出任何文件,因为在这个目录的多个子目录中(递归地(有这样的文件。

我得到这个没有grep:

--rw-r--r-- 3 user mistapopo 6127742 2021-06-29 15:20 /path/to/directory/data/6e.m9iujse8t6.zip
--rw-r--r-- 3 user mistapopo 5940008 2021-06-29 15:20 /path/to/directory/data/cars/a5.hkjdsjue876.zip
--rw-r--r-- 3 user mistapopo 6127742 2021-06-29 15:20 /path/to/directory/data/users/cars/4.he75fdgsgds.zip

有人能帮我解决这个问题吗?

你能试试吗

hdfs dfs -ls -R /path/to/directory > /tmp/files"
grep ".zip$" /tmp/files

将答案标记为已接受,它解决了您的问题

最新更新