从命令行管理程序的日志文件中删除 HTML 代码



我有一个包含html代码的日志文件,我需要删除html标签之间的所有内容,以便此文件中每个可能的匹配项。使用过滤器怎么可能?

我的文件示例:

some text here
<html>
code
</html>
some text there
<html>
code
</html>
some other text

输出应为:

some text here
some text there
some other text

这个awk应该做:

awk '/<html>/{f=1;next} !f; /</html>/{f=0}' file
some text here
some text there
some other text

为什么不只是:

sed '/<html>/,/</html>/d'

它适用于您的示例。

相关内容

  • 没有找到相关文章

最新更新