Azure KQL Regex为命名捕获组捕获带有extract_all()的句子



我正试图使用extract_all((函数从日志中提取以下格式的多个值:

v1=value1 v2=May 18 2021 v3=value3 v4=The dog jumps over the fence v5=192.168.1.1

extract_all((格式如下:

extract_all(@"(?P<key>w+)?=(?P<value>S*)?", dynamic(["key","value"]), restconvert)

我尝试了多种方法来捕捉v4的完整句子,但都没能。其中,我使用了(?P<value>w+)?(?P<value>S* d* d*)?。后者能够捕获日期,而不会对字符串的连续性造成任何问题。我还尝试了正则表达式第二部分中的逻辑或,以区分没有成功的情况。w+( w+)*和类似的变体扰乱了其他值,例如IP地址和字符串的连续性。

我没有使用解析运算符,因为字段会随时间变化。

有什么提示吗?

如果采用负前瞻,这会容易得多,但RE2显然不支持它。这会处理单词之间的许多空格并跳过空格,但有时会在值上包含额外的空格,如果值和下一个密钥标记之间有多个空格的话。

print text="v1=value1 v2=May 18 2021 v3=value3   v4=The dog jumps over the fence"
| extend values = extract_all(@"(?P<key>w+)=(?P<value>(?:w+(?:s?|z))+)(?:s|z)", dynamic(["key","value"]

结果:

[
[
""v1"",
""value1 ""
],
[
""v2"",
""May 18 2021 ""
],
[
""v3"",
""value3 ""
],
[
""v4"",
""The dog jumps over the fence""
]
]

最新更新