使用awk按行向后搜索,并将结果附加到下一行



我正在尝试生成一个临时主机文件,该文件基于dnsmasq提供的DNS日志。我大部分时间都在工作,但我对CNAME有问题。我将展示我迄今所取得的成就。

日志中有3种类型的响应,我需要获得。最简单的是很容易从日志中提取,例如

Jun 20 14:27:59 dnsmasq[2551]: reply stackoverflow.com is 64.34.119.12

这可以使用输出到"64.34.119.12 stackoverflow.com">

grep reply /tmp/dnslog | grep -v 'NXDOMAIN|NODATA' | awk '{print $8 " " $6}'

另一种类型的日志涉及CNAME,这里是一个例子;

Jun 20 14:42:11 dnsmasq[2551]: reply www.videolan.org is <CNAME>
Jun 20 14:42:11 dnsmasq[2551]: reply ganesh.videolan.org is 88.191.250.2

这可以使用输出到"88.191.250.2 ganesh.videolan.org www.videolan.org">

grep reply /tmp/dnslog | grep -v 'NXDOMAIN|NODATA' | awk '{print $8 "t" $6}' | awk '/CNAME/ {name=$2; getline ; print $0 " " 'name'}'

但是,此方法不适用于以下类型的日志,其中存在多个CNAME

Jun 20 15:00:42 dnsmasq[2551]: reply en.wikipedia.org is <CNAME>                        
Jun 20 15:00:42 dnsmasq[2551]: reply wikipedia-lb.wikimedia.org is <CNAME>              
Jun 20 15:00:42 dnsmasq[2551]: reply wikipedia-lb.esams.wikimedia.org is 91.198.174.225

上一个命令给出以下结果

<CNAME> wikipedia-lb.wikimedia.org      en.wikipedia.org

通过将第一个命令与第二个命令一起使用,wikipedia-lb.esams.wikimedia.org与91.198.174.225相关联,但是wikipedia-lb.wikimedia.org与wikipedian-lb.esams.wikimeedia.org不相关联。理想的结果应该是以下

91.198.174.225 wikipedia-lb.esams.wikimedia.org wikipedia-lb.wikimedia.org      en.wikipedia.org

为了解决这个问题,我认为需要向后读取该文件,但是这样做不会打乱awk的getline部分,从而附加到下一行吗?

理想情况下,我希望将这两种类型的日志组合成一个命令,然后输出所有内容,而不必分别运行这两个脚本。有人能帮助修复awk命令吗?

下面是"grep-reply/var/dnslog"的示例,以及要输出的所需主机文件。目前还有其他次要问题。这些将在所需的主机输出中突出显示。

Jun 20 15:28:21 dnsmasq[2551]: reply photos-a.ak.fbcdn.net is <CNAME>
Jun 20 15:28:21 dnsmasq[2551]: reply photos-a.ak.facebook.com.edgesuite.net is <CNAME>
Jun 20 15:28:21 dnsmasq[2551]: reply a995.dspmm1.akamai.net is 213.200.108.25
Jun 20 15:28:21 dnsmasq[2551]: reply a995.dspmm1.akamai.net is 213.200.108.48
Jun 20 15:28:21 dnsmasq[2551]: reply a995.dspmm1.akamai.net is 213.200.108.64
Jun 20 15:28:21 dnsmasq[2551]: reply a995.dspmm1.akamai.net is 213.200.108.9
Jun 20 15:28:21 dnsmasq[2551]: reply a995.dspmm1.akamai.net is 213.200.108.26
Jun 20 15:28:21 dnsmasq[2551]: reply a995.dspmm1.akamai.net is 213.200.108.51
Jun 20 15:28:21 dnsmasq[2551]: reply a995.dspmm1.akamai.net is 213.200.108.8
Jun 20 15:28:21 dnsmasq[2551]: reply a995.dspmm1.akamai.net is 213.200.108.50
Jun 20 15:28:21 dnsmasq[2551]: reply a995.dspmm1.akamai.net is 213.200.108.65
Jun 20 15:28:22 dnsmasq[2551]: reply stackoverflow.com is 64.34.119.12
Jun 20 15:29:41 dnsmasq[2551]: reply www.wikipedia.org is <CNAME>
Jun 20 15:29:41 dnsmasq[2551]: reply wikipedia-lb.wikimedia.org is <CNAME>
Jun 20 15:29:41 dnsmasq[2551]: reply wikipedia-lb.esams.wikimedia.org is 91.198.174.225
Jun 20 15:29:42 dnsmasq[2551]: reply en.wikipedia.org is <CNAME>
Jun 20 15:29:42 dnsmasq[2551]: reply wikipedia-lb.wikimedia.org is <CNAME>
Jun 20 15:29:42 dnsmasq[2551]: reply wikipedia-lb.esams.wikimedia.org is 91.198.174.225
Jun 20 15:29:42 dnsmasq[2551]: reply ja.wikipedia.org is <CNAME>
Jun 20 15:29:42 dnsmasq[2551]: reply wikipedia-lb.wikimedia.org is <CNAME>
Jun 20 15:29:42 dnsmasq[2551]: reply wikipedia-lb.esams.wikimedia.org is 91.198.174.225

主机文件

213.200.108.26  a995.dspmm1.akamai.net photos-a.ak.facebook.com.edgesuite.net photos-a.ak.fbcdn.net 
##ideally select 1 host at random from multiple of a995.dspmm1.akamai.net, although list may be randomised already so 1st will suffice##
64.34.119.12    stackoverflow.com
91.198.174.225  wikipedia-lb.esams.wikimedia.org wikipedia-lb.wikimedia.org www.wikipedia.org
91.198.174.225  wikipedia-lb.esams.wikimedia.org wikipedia-lb.wikimedia.org en.wikipedia.org
91.198.174.225  wikipedia-lb.esams.wikimedia.org wikipedia-lb.wikimedia.org ja.wikipedia.org 
##Ideally, detect these similarities for wikipedia and convert the 3 lines into this;##
91.198.174.225  wikipedia-lb.esams.wikimedia.org wikipedia-lb.wikimedia.org www.wikipedia.org en.wikipedia.org ja.wikipedia.org

这样做的目的是使文件可以在低带宽、高延迟的链路上分发,因此文件应该尽可能小。我知道长时间使用此文件会导致很多问题,我已将该文件配置为仅在短时间内有效。如果有人能帮助解决所指出的问题,我们将不胜感激。此外,我可用的UNIX应用程序范围有限。如果上述内容可以在awk中实现,那将是更可取的。提前谢谢!

使用awksort:

..|awk '{if($8 ~ /<CNAME>/){load=load" "$6}else{print $8" "load" "$6;load=""}}'
  | sort -u -k2

使用awk -f parse.awk dnsmasq.log进行调用。

/reply/ { 
    host = $6;
    ip = $8;
    names[length(names)+1] = host;
    if (ip !~ /CNAME/) {
    # assign all names up to now the same IP
    # This will overwrite any previous IP assignment as well
    for (i in names) IPs[names[i]] = ip;
    delete names;
    }
}
END {
    # collate hostnames for a particular IP
    for (host in IPs) hosts[IPs[host]] = hosts[IPs[host]]" "host;
    for (IP in hosts) print IP hosts[IP];
}

相关内容

  • 没有找到相关文章

最新更新