我有一堆文件,其中有多行包含标头的副本。有没有一种方法可以使用sed删除除第一行以外的所有引用。我在想:
sed -i '/textOnlyInHeader/d' file.txt
但这也会删除标题。作为奖励,有没有一种方法可以递归地对一堆子目录中的所有文件执行此操作?
我认为gawk
最好。尝试:
gawk -i inplace 'NR==1 { r = $0; print } r == $0 { next }1' file.txt
对于单个目录中的所有文件,将NR
更改为FNR
并运行:
gawk -i inplace '...' *.txt
对于许多子目录中的所有文件,可以使用for
循环:
for i in $(find /path/to/files -type f -name '*.txt'); do ... ; done
如果您使用的是旧的或非GNU AWK,则需要首先写入一个临时文件:
awk '...' file.txt > file.tmp && mv file.tmp file.txt
这可能对你有用(GNU sed(:
sed '1h;1b;G;/^(.*)n1$/!P;d' file
sed -i '1 !{
/textOnlyInHeader/ d
}' file.txt
避开第一条线路,在另一条线路上使用你的sed
对于递归,您可以向sed传递一个文件列表(而不是文件.txt(。因此,在使用shell函数(find,ls,…,loop(之前准备该列表,并将其作为参数传递给sed
我知道使用gawk
已经有一个可接受的答案,但使用sed
:
sed -i -e '2,$s/textOnlyInHeader/DELETELINE/' -e '/DELETELINE/d' file.txt
对于递归答案,我同意Steve的观点,使用find
循环是可行的。