增强功能的正常化和内部优化如何?这如何影响相关性



我是弹性搜索的新手。我很难理解文档中字段的增强值的校准和缩放。就像我们应该如何确定字段的增强值,以便它按预期工作。我还浏览了一些在线博客和ES Doc,它写的是ES对增强价值的正常化和内部优化?它如何工作?

,例如:如果我们的文档中有标签,标题,名称和文本字段,我们应该如何确定这些标签的增强值?

lasticsearch使用布尔模型匹配文档,然后使用评分模型来确定相关性(即排名)。评分模型利用TF/IDF分数,再加上一些其他功能。这些TF/IDF分数是针对查询中每个匹配字段计算的,然后汇总以产生文档的整体分数。要深入研究此过程,我建议在您的查询上进行解释,以查看每个字段的分数如何影响文档的整体相关性。

作为数据专家,您处于最佳位置,以确定哪些字段应最大程度地影响文档的相关性。找到适合字段的提升值是要调整杠杆,直到找到最适合您所需结果的公式(如果您有用户,则A/B测试可以在这里有所帮助)。

最新更新