Elasticsearch 自定义同义词/词干提取分数



>我正在使用 elasticsearch 1.1.2。

我在可搜索字段上使用具有不同权重的多重匹配查询。

例:

{ "multi_match" : { "查询" : "这是一个测试", "字段" : [ "标题^3", "描述^2", "正文" ] }}

因此,在我的示例中,标题的重要性是正文的三倍。

我想根据找到的匹配项自定义每个字段的权重。

假设我搜索"伤害",我想:

-如果找到完全匹配,则为标题指定系数 3:标题包含"伤害"一词。

-如果找到同义词,则为标题提供系数 2:标题包含单词"瘀伤"。

-如果找到词干,则给标题一个系数 1:标题包含"伤害"一词。

有没有办法做这种定制?

谢谢!

您可以通过对

title值使用多字段映射来实现这一点。

它允许您将多种类型映射到相同的输入值,从而使用不同的分析器。

假设您已经为同义词和词干分析定义了自定义分析器,请尝试更新您的映射:

PUT /<index_name>/<type_name>/_mapping
{
  "<type>": {
    "properties": {
      "title": {
        "type": "string",
        "fields": {
          "exact": {
            "type": "string",
            "index": "not_analyzed"
          },          
          "synonym": {
            "type": "string",
            "index": "analyzed",
            "analyzer": "synonym_analyzer"
          },
          "stemmed": {
            "type": "string",
            "index": "analyzed",
            "analyzer": "stemming_analyzer"
          }
        }
      }
    }
  }
}

以下查询应根据需要匹配:

POST /<index_name>/<type_name>/_search
{
  "query": {
    "multi_match": {
      "query": "injury",
      "fields": [
        "title.exact^3",
        "title.synonym^2",
        "title.stemmed"
      ]
    }
  }
}

最新更新