是否有一个用于弹性搜索的词干分析器可以将"broken"更改为"break"



下面是我想让系统做的事情:断裂:打破:打破破碎:打破输入:输入输入:输入输入:输入

我已经索引了字段如下:"身体":{"类型":"文本","字段":{"是":{"类型":"文本","分析":"英语"}}}

当我查询"breaking and enter"时,我可以看到在body中搜索的是什么。派生字段是:"break and enter"。看起来很好。然而,当我查询"broke and enter"时,我得到的是:"broke and enter"。因此,显然,当使用"英语"词干时,"broke"不会变成"break"。同样,"broken and enter"变成了"broken and enter"。因此,ES显然不会将"broke"或"broken"更改为"break"(根据这个:snowball,我想这解释了为什么使用这个)。

那么,是否有一种方法可以指定一个"已知"的梗来完成我正在尝试做的事情?

您的需求可以通过Dictionary Stemmer来满足,它对词干进行字典查找。算法系统在不了解词根的情况下进行处理,他们只是通过算法来完成。看看亨斯佩尔·斯坦默,我想它会起作用的。https://www.elastic.co/guide/en/elasticsearch/guide/current/hunspell.html

最新更新