弹性搜索中的词干提取替换原始字符串



我使用以下设置来创建 ES 索引。

"settings": {
    "analysis" : {
        "analyzer" : {
            "my_analyzer" : {
                "tokenizer" : "standard",
                "filter" : ["standard", "lowercase", "my_stemmer"]
            }
        },
        "filter" : {
            "my_stemmer" : {
                "type" : "stemmer",
                "name" : "english"
            }
        }
    }
}

我注意到,在分析时,词干分析器用词干词替换了原始字符串。有没有办法同时索引原始字符串和词干标记?

您的问题是关于词干分析器令牌过滤器的"preserve_original"参数:

您会发现"preserve_original",例如用于单词分隔符令牌过滤器,但不适用于词干标记过滤器。

如果您需要原始单词,例如用于聚合,您可以使用合适的分析器将字段复制到另一个字段。

如果您需要将原始文件放在索引的同一位置,则必须包装词干分析器并构建自己的分析器作为插件。

相关内容