如何搜索和替换多个 ZIP 文件中的字符串



我在找到正确的命令来搜索和查找包含 Unix 上的 XML 文件的多个 ZIP 文件中的字符串时遇到了问题。

我能够在多个 ZIP 文件中找到搜索字符串,但未能成功替换查找结果并替换该字符串。

不幸的是,这并不完全有效。一旦找到解压缩文件的字符串(到临时位置),我正在尝试使用 grep 和 sed 命令。但是假设我可以编辑到临时可能不正确?

oldAddress='<ns1:line1/>'
newAddress='<ns1:line1>somestring</ns1:line1>'
for file in *.zip; do
    unzip -c "$file" | grep -q "<ns1:line1/>" | xargs -l {} sed -i 's/$oldAddress/$newAddress/g'
done

提前谢谢。

关于循环结构的一些注意事项:

首先,虽然使用全局变量很诱人,但 bash 也支持以下循环样式:

 while read line ; do   echo $line; done < <(find . -iname 'file*zip')

其次,您可以使用zipgrep搜索文件,然后只解压缩那些真正需要解压缩的文件。这将导致文件的两次通货紧缩。一次用于格雷普,一次用于解压缩真正需要解压缩的人。但是,这将使我们无需将冗余文件压缩回去。

第三,您搜索 2 次,对于大文件或多个文件,这将慢两倍:

 grep -q "<ns1:line1/>" | xargs -l {} sed -i 's/$oldAddress/$newAddress/g'

相反,您可以仅解压缩那些匹配的文件,并仅使用 sed 一步进行搜索和替换。

建议的解决方案

# From within a (bash) script you need to use double quotes instead of singel qoutes to expand the variable
newAddress="<ns1:line1>somestring</ns1:line1>"
oldAddress="<ns1:line1/>"
for fname in *.zip
do
  zipgrep -q $oldAddress $fname;    
  if [ $? -eq 0 ]; then
     filename="${fname%.*}" 
     unzip -qp $fname | sed -e 's#'$oldAddress'#'$newAddress'#g' > $filename
     zip $filename.zip $filename
  fi
done

测试数据

下面是一个用于创建测试数据的 for 循环:

for i in {1..4} ; do touch file$i; done
while read line ; do   
  echo '<ns1:line1/>' > $line;   
  zip $line.zip $line
  rm $line
done < <(find . -iname 'file*')

相关内容

  • 没有找到相关文章

最新更新