我目前正在尝试制作一个脚本,该脚本将grep输入以查看某些内容是否属于某种文件类型(例如zip),尽管文件类型之前的文本可以是任何东西,例如
something.zip
this.zip
that.zip
都属于这一类。我正在尝试使用通配符对这些进行 grep,到目前为止我已经尝试过这个
grep ".*.zip"
但是每当我这样做时,它都会发现.zip
文件很好,但如果.zip
后面有其他字符,它仍然会显示输出,例如 .zippppppp
或 .zipdsjdskjc
仍然会被 grep 拾取。话虽如此,我应该怎么做才能防止 grep 在.zip
后显示具有其他字符的匹配项?
用 $
测试行尾,并使用反斜杠转义第二个.
,使其仅匹配句点,而不匹配任何字符。
grep ".*.zip$"
但是,如果要列出当前目录中的所有.zip
文件,或者find . -name "*.zip"
从(包括)当前目录开始的子目录中的所有.zip
文件,则ls *.zip
更自然的方法。
在 UNIX 上,尝试:
find . -type f -name *.zip
您还可以使用 grep 查找具有特定扩展名的所有文件:
find .|grep -e ".gz$"
.
表示当前文件夹。如果要指定当前文件夹以外的文件夹,只需将.
替换为文件夹的路径即可。下面是一个示例:让我们查找所有以 .gz
结尾且位于文件夹/var/log 中的文件
find /var/log/ |grep -e ".gz$"
输出类似于以下内容:
✘ ⚙> find /var/log/ |grep -e ".gz$"
/var/log//mail.log.1.gz
/var/log//mail.log.0.gz
/var/log//system.log.3.gz
/var/log//system.log.7.gz
/var/log//system.log.6.gz
/var/log//system.log.2.gz
/var/log//system.log.5.gz
/var/log//system.log.1.gz
/var/log//system.log.0.gz
/var/log//system.log.4.gz
$
符号表示文件扩展名以gz结尾
我用它来获取文件夹中文件类型的列表。
find . -type f | egrep -i -E -o ".{1}w*$" | sort -su
输出例如:
.DS_Store
.MP3
.aif
.aiff
.asd
.doc
.flac
.jpg
.m4a
.m4p
.m4r
.mp3
.pdf
.png
.txt
.wav
.wma
.zip
奖励:与
find . -type f | egrep -i -E -o ".{1}w*$" | sort | uniq -c
您将获得文件计数:
106 .DS_Store
35 .MP3
89 .aif
5 .aiff
525 .asd
1 .doc
60 .flac
48 .jpg
149 .m4a
11 .m4p
1 .m4r
12844 .mp3
1 .pdf
5 .png
9 .txt
108 .wav
44 .wma
2 .zip
你需要做几件事。 它应该看起来像这样:
grep '.*.zip$'
您需要转义第二个点,因此它只匹配一个点,而不是任何字符。 使用单引号使转义更容易一些。
您需要行尾的美元符号来指示您希望"zip"出现在行尾。
grep -r pattern --include="*.txt" /path/to/dir/
尝试: grep -o -E "(\.([A-z])+)+"
我用它来获取多点/多个扩展名。所以如果输入是hello.tar.gz
,那么它将输出.tar.gz
。对于单点,请使用 grep -o -E "\.([A-z])+$"
。在Cygwin/MingW+MSYS上测试。
上面例子的另一个修复/插件:
# multi-dotted/multiple extensions
grep -oEi "(\.([A-z0-9])+)+" file.txt
# single dotted
grep -oEi "\.([A-z0-9])+$" file.txt
这将获得文件扩展名,如".mp3"等。
只是回顾其他一些答案。.*
不是必需的,如果您正在寻找某个文件扩展名,最好包含 -i,以便它不区分大小写;例如,如果文件是 HELLO.ZIP。我认为引号也没有必要。
grep -i .zip$
如果您只想在当前文件夹中查找,为什么不使用这个没有 grep 的简单命令?
ls *.zip
只需执行:
grep ".*.zip$"
"$"表示行尾