避免ElasticSearch查询中的幻数提升



我希望由ElasticSearch查询生成的、将字段(称为"fubar")设置为查询时确定的某些值的文档始终位于未将fubar设置为这些值之一的文档之前。

例如,在查询时,我决定fubar设置为1、5或10的文档应该排在所有其他文档之前。

现在,我正在使用function_score对值列表中的fubar进行过滤,并将过滤器的升压设置为10倍。然后对查询分数和这个增强的过滤器进行求和。

这感觉像是一次黑客攻击——我怎么能确定不需要100倍的提升?有没有一种"干净"的方法可以做到这一点,而不会对最大可能的文档分数进行假设?换句话说,有没有一种方法可以避免"神奇"的提升数字?

编辑:修改查询排序以匹配OP澄清的问题。

{
  "query" : {"match_all" : {}},
  "sort" : [
    {"_script" : {
      "script" : "[1, 10, 15].contains(doc['fubar'].value.toInteger()) ? 1 : 0",
      "type" : "number",
      "order" : "desc"
    }},
    "_score"
  ]
}

这种排序依赖于指定的脚本来动态确定每个文档中的fubar是否相应地等于1、10或15排序。在这个例子中,我选择将结果映射到1或0,但我相信还有很多其他方法可以实现

{"name":"Alice", "fubar":1}
{"name":"Bob", "fubar":21}
{"name":"Carol", "fubar":33}
{"name":"David", "fubar":17}
{"name":"Evelyn", "fubar":5}
{"name":"Fred", "fubar":10}

我得到了以下结果(为了可读性,多余的位被截断):

"hits" : [ {
  "_index" : "test",
  "_type" : "test",
  "_id" : "1",
  "_score" : 1.0,
  "_source":{"fubar": 1, "name": "Alice"},
  "sort" : [ 1.0, 1.0 ]
}, {
  "_index" : "test",
  "_type" : "test",
  "_id" : "6",
  "_score" : 1.0,
  "_source":{"fubar": 10, "name": "Fred"},
  "sort" : [ 1.0, 1.0 ]
}, {
  "_index" : "test",
  "_type" : "test",
  "_id" : "4",
  "_score" : 1.0,
  "_source":{"fubar": 17, "name": "David"},
  "sort" : [ 0.0, 1.0 ]
}, {
  "_index" : "test",
  "_type" : "test",
  "_id" : "5",
  "_score" : 1.0,
  "_source":{"fubar": 5, "name": "Evelyn"},
  "sort" : [ 0.0, 1.0 ]
}, {
  "_index" : "test",
  "_type" : "test",
  "_id" : "2",
  "_score" : 1.0,
  "_source":{"fubar": 21, "name": "Bob"},
  "sort" : [ 0.0, 1.0 ]
}, {
  "_index" : "test",
  "_type" : "test",
  "_id" : "3",
  "_score" : 1.0,
  "_source":{"fubar": 33, "name": "Carol"},
  "sort" : [ 0.0, 1.0 ]
} ]

请注意,Alice和Fred首先返回,这是所需的行为。对于我的琐碎案例,所有文档的得分都是1.0,因此使用_score作为次要排序标准没有效果,但真实世界的数据(具有真实世界的得分)会考虑到这一点。

相关内容

  • 没有找到相关文章

最新更新