有人能解释一下重新格式化awk()|sort|uniq-c|sort-rg输出的最佳方法吗

我制作了一个用于分析Windows日志消息编号的脚本。uniq-c数字的输出很难预测，因为根据数字的大小，有不同的空白。在这一点上，我手动删除空白。

这是对消息进行排序和计数的命令：

cat nt2.rawlog | awk 'BEGIN {FS=","} {print $3,$4,$6,$7}' | sort | uniq -c | sort -rg >> ~/tempNT2.report

这是我对示例输出的最佳尝试：

21340  4624,Windows-Security-Audit-Log,Success Audit,Logon
 1209  4658,Windows-Security-Audit-Log,Success Audit,Privileged Logon

我想要的输出是：

[tab]21340[tab]--[tab]Security Audit Log 4624 (Logon Success Audit)
[tab]1209[tab]--[tab]Security Audit Log 4658 (Privileged Logon Success Audit)

类似的东西

awk -F , '{ i = split($1, n, / +/);
  printf ("t%dt--t%s %d (%s %s)n", n[i-1], $2, n[i], substr($4, 2), $3) }'

字段分离器CCD_ 1执行第一级别的拆分；然后我们在空白上分割第一个字段，并将数字提取到n中。n中元素的数量取决于字段是否有前导空格，因此我们从末尾开始计算最后两个字段。最后一个字段有一个令人讨厌的前导空格，所以我们从该字段的第二个字符中提取一个子字符串。

相关内容