单个单词相似性检查有哪些选项?
考虑以下情况:我们有存在字段电子邮件的文档。添加新文档时,我们要检查是否有任何文档的电子邮件与具有某些相似性约束的新文档相似 - 例如 80% 匹配。
是否有任何可以使用的特定内置查询?
您可以使用
Fuzzy Query
,您可以在参数fuzziness
中提供搜索字符串和Levenshtein距离。此处的查询参考
另外,要从百分比计算列文施泰因距离,这可能会有所帮助。