我有一个包含html代码的日志文件,我需要删除html标签之间的所有内容,以便此文件中每个可能的匹配项。使用过滤器怎么可能?
我的文件示例:
some text here
<html>
code
</html>
some text there
<html>
code
</html>
some other text
输出应为:
some text here
some text there
some other text
这个awk
应该做:
awk '/<html>/{f=1;next} !f; /</html>/{f=0}' file
some text here
some text there
some other text
为什么不只是:
sed '/<html>/,/</html>/d'
它适用于您的示例。