Elasticsearch 无痛地将字符串字段(包含 XML)放入变量中



>我正在尝试解析包含XML的Elasticsearch字符串字段(名为Request.Body(。此字段包含一个 SOAP 请求字符串,如下所示:

<?xml version="1.0" encoding="UTF-8"?>
<SOAP-ENV:Envelope xmlns:SOAP-ENV="http://schemas.xmlsoap.org/soap/envelope/" xmlns:ns1="myURL">
  <SOAP-ENV:Body>
    <ns1:find>
      <token>myData</token>
      <login>myData</login>
      <language>myData</language>
      <search>myData</search>
      <contains>false</contains>
    </ns1:find>
  </SOAP-ENV:Body>
</SOAP-ENV:Envelope>

我的目标是使用无痛语言在脚本字段(Kibana 中(中提取 search 标签的值。

我试过这个:

def field = doc['Request.Body'].value;
if (field != null) {
  def matcher = /<search>(.*)</search>/.matcher(field);
  if (matcher.find()) {
    return matcher.group(1);
  }
  return "No match";
}
return "No field"; 

此代码始终返回 No match

为了调试,我尝试返回 doc['Request.Body'].value 的值,在此示例中,它仅返回1.0而不是我的完整 XML。

我还尝试将这个对象中 values List 的值与该代码连接起来:

def field = doc['Request.Body'].getValues().stream().collect(Collectors.joining(""));
if (field != null) {
  def matcher = /<search>(.*)</search>/.matcher(field);
  if (matcher.find()) {
    return matcher.group(1);
  }
  return "No match";
}
return "No field"; 

现在,field变量等于包含 XML 标签值,但我丢失了 XML 标签,所以我无法使用正则表达式提取数据,并且像第一个脚本一样,它总是返回 No match .

所以我的问题是,如何在脚本的变量中获取字段的完整 XML 值?为什么 Elasticsearch 要"解析"我的 XML?

任何帮助将不胜感激。谢谢。

这是一个古老的话题,但遇到了同样的问题。我能够通过以下方式使用字段定义来解决它:

def field = params._source.Request.Body;

此代码可以从刺痛字段中提取相关信息:

def field = params._source.message;
if (field != null) {
def matcher = /<decisionText>(.*)</decisionText>/.matcher(field);
if (matcher.find()) {
return matcher.group(1);
}
return "No match";
}
return "No field";

就我而言,数据在"消息"字段中

最新更新