在包含变量的正则表达式之后打印文件中的剩余行

我有以下数据：

====> 后台进程的启动日志： HRBkg 你好在 2013/09/27 23：20：20 日志级别 3
09/27 23：20：20 I 后台进程正在使用处理模型 #： 3
09/27 23：20：23 I 09/27 23：20：23 I
-- 已开始导入外部密钥
====> 后台进程的启动日志：HRBkg 你好 2013/09/30 07：31：07 日志级别 3
09/30 07：31：07 I 后台进程正在使用处理模型 #： 3
09/30 07：31：09 I 09/30 07：31：09 I
-- 已开始导入外部密钥

我需要在====> START LOG的最后一场比赛后提取剩余的文件内容.....
我已经多次尝试使用 sed/awk ，但是，我似乎无法awk在我的正则表达式中使用变量。我试图包含的变量是日期(2013/09/30(，因为这就是使该行独特的原因。
我在一台HP-UX机器上，无法使用grep -A.

有什么建议吗？

无需测试特定时间只是为了找到文件中的最后一个条目：

awk '
    BEGIN { ARGV[ARGC] = ARGV[ARGC-1]; ARGC++ }
    NR == FNR { if (/START LOG/) lastMatch=NR; next }
    FNR == lastMatch { found=1 }
    found
' file

这可能对你有用(GNU sed(：

a=2013/09/30
sed '|START LOG.*'"$a"'|{h;d};H;$!d;x' file

这将返回您想要的输出。

sed -n '/START LOG/h;/START LOG/!H;$!b;x;p' file

如果你有tac可用，你可以很容易地做到。

tac <file> | sed '/START LOG/q' | tac

这是

Python中的一个：

#!/usr/bin/python
import sys, re
for fn in sys.argv[1:]:
    with open(fn) as f:
        m=re.search(r'.*(^====> START LOG.*)',f.read(), re.S | re.M)
        if m:
            print m.group(1)

然后运行：

$ ./re.py /tmp/log.txt
====> START LOG for Background Process: HRBkg Hello on 2013/09/30 07:31:07 Log Level 3
09/30 07:31:07 I Background process is using processing model #: 3
09/30 07:31:09 I
09/30 07:31:09 I -- Started Import for External Key

如果要排除====> START LOGS..位，请将正则表达式更改为：

r'.*(?:^====> START LOG.*?$n)(.*)'

作为记录，您可以轻松地将变量与 awk 中的正则表达式匹配，反之亦然。

awk -v date='2013/09/30' '$0 ~ date {p=1} p' file

如果输入行与日期匹配，则将 p 设置为 1，如果输入行不为零，则打印p。

(回想一下，Awk 中的常规形式是条件{操作}其中操作块是可选的;如果省略，则默认操作是打印当前输入行。

这将打印最后一个START LOG，它为最后一个块设置一个标志并打印它。

awk 'FNR==NR  { if ($0~/^====> START LOG/) f=NR;next} FNR>=f' file file

您可以使用变量，但是如果您有另一个带有其他日期的文件，则需要提前知道日期。

var="2013/09/30"
awk '$0~v && /^====> START LOG/ {f=1}f' v="$var" file
====> START LOG for Background Process: HRBkg Hello on 2013/09/30 07:31:07 Log Level 3
09/30 07:31:07 I Background process is using processing model #: 3
09/30 07:31:09 I
09/30 07:31:09 I -- Started Import for External Key

使用 GNU awk ( gawk ( 或 Mikes awk ( mawk (，您可以设置记录分隔符 ( RS (，以便每条记录包含一条完整的日志消息。因此，您需要做的就是打印END块中的最后一个：

awk 'END { printf "%s", RS $0 }' RS='====> START LOG' infile

输出：

====> START LOG for Background Process: HRBkg Hello on 2013/09/30 07:31:07 Log Level 3
09/30 07:31:07 I Background process is using processing model #: 3
09/30 07:31:09 I
09/30 07:31:09 I -- Started Import for External Key

在 perl 中回答：

如果您的日志位于假设 filelog.txt 中。

my @line;
open (LOG, "<filelog.txt") or "die could not open filelog.tx";
while(<LOG>) {
   @line = $_;
}
my $lengthline = $#line;
my @newarray;
my $j=0;
for(my $i= $lengthline ; $i >= 0 ; $i++) {
  @newarray[$j] = $line[$i];
  if($line[$i] =~ m/^====> START LOG.*/) {
    last;
  }
  $j++;
}
print "@newarray n";

相关内容

最新更新

热门标签：