在包含变量的正则表达式之后打印文件中的剩余行



我有以下数据:

====> 后台进程的启动日志: HRBkg 你好 在 2013/09/27 23:20:20 日志级别 3
09/27 23:20:20 I 后台进程正在使用 处理模型 #: 3
09/27 23:20:23 I 09/27 23:20:23 I
-- 已开始导入外部密钥
====> 后台进程的启动日志:HRBkg 你好 2013/09/30 07:31:07 日志级别 3
09/30 07:31:07 I 后台进程正在使用 处理模型 #: 3
09/30 07:31:09 I 09/30 07:31:09 I
-- 已开始导入外部密钥

我需要在====> START LOG的最后一场比赛后提取剩余的文件内容.....
我已经多次尝试使用 sed/awk ,但是,我似乎无法awk在我的正则表达式中使用变量。 我试图包含的变量是日期(2013/09/30(,因为这就是使该行独特的原因。
我在一台HP-UX机器上,无法使用grep -A.

有什么建议吗?

无需测试特定时间只是为了找到文件中的最后一个条目:

awk '
    BEGIN { ARGV[ARGC] = ARGV[ARGC-1]; ARGC++ }
    NR == FNR { if (/START LOG/) lastMatch=NR; next }
    FNR == lastMatch { found=1 }
    found
' file

这可能对你有用(GNU sed(:

a=2013/09/30
sed '|START LOG.*'"$a"'|{h;d};H;$!d;x' file

这将返回您想要的输出。

sed -n '/START LOG/h;/START LOG/!H;$!b;x;p' file

如果你有tac可用,你可以很容易地做到。

tac <file> | sed '/START LOG/q' | tac
这是

Python中的一个:

#!/usr/bin/python
import sys, re
for fn in sys.argv[1:]:
    with open(fn) as f:
        m=re.search(r'.*(^====> START LOG.*)',f.read(), re.S | re.M)
        if m:
            print m.group(1)

然后运行:

$ ./re.py /tmp/log.txt
====> START LOG for Background Process: HRBkg Hello on 2013/09/30 07:31:07 Log Level 3
09/30 07:31:07 I Background process is using processing model #: 3
09/30 07:31:09 I
09/30 07:31:09 I -- Started Import for External Key

如果要排除====> START LOGS..位,请将正则表达式更改为:

r'.*(?:^====> START LOG.*?$n)(.*)'

作为记录,您可以轻松地将变量与 awk 中的正则表达式匹配,反之亦然。

awk -v date='2013/09/30' '$0 ~ date {p=1} p' file

如果输入行与日期匹配,则将 p 设置为 1,如果输入行不为零,则打印p

(回想一下,Awk 中的常规形式是条件{操作}其中操作块是可选的;如果省略,则默认操作是打印当前输入行。

这将打印最后一个START LOG,它为最后一个块设置一个标志并打印它。

awk 'FNR==NR  { if ($0~/^====> START LOG/) f=NR;next} FNR>=f' file file

您可以使用变量,但是如果您有另一个带有其他日期的文件,则需要提前知道日期。

var="2013/09/30"
awk '$0~v && /^====> START LOG/ {f=1}f' v="$var" file
====> START LOG for Background Process: HRBkg Hello on 2013/09/30 07:31:07 Log Level 3
09/30 07:31:07 I Background process is using processing model #: 3
09/30 07:31:09 I
09/30 07:31:09 I -- Started Import for External Key

使用 GNU awk ( gawk ( 或 Mikes awk ( mawk (,您可以设置记录分隔符 ( RS (,以便每条记录包含一条完整的日志消息。因此,您需要做的就是打印END块中的最后一个:

awk 'END { printf "%s", RS $0 }' RS='====> START LOG' infile

输出:

====> START LOG for Background Process: HRBkg Hello on 2013/09/30 07:31:07 Log Level 3
09/30 07:31:07 I Background process is using processing model #: 3
09/30 07:31:09 I
09/30 07:31:09 I -- Started Import for External Key

在 perl 中回答:

如果您的日志位于假设 filelog.txt 中。

my @line;
open (LOG, "<filelog.txt") or "die could not open filelog.tx";
while(<LOG>) {
   @line = $_;
}
my $lengthline = $#line;
my @newarray;
my $j=0;
for(my $i= $lengthline ; $i >= 0 ; $i++) {
  @newarray[$j] = $line[$i];
  if($line[$i] =~ m/^====> START LOG.*/) {
    last;
  }
  $j++;
}
print "@newarray n";

最新更新