弹性搜索中的词干提取替换原始字符串

我使用以下设置来创建 ES 索引。

"settings": {
    "analysis" : {
        "analyzer" : {
            "my_analyzer" : {
                "tokenizer" : "standard",
                "filter" : ["standard", "lowercase", "my_stemmer"]
            }
        },
        "filter" : {
            "my_stemmer" : {
                "type" : "stemmer",
                "name" : "english"
            }
        }
    }
}

我注意到，在分析时，词干分析器用词干词替换了原始字符串。有没有办法同时索引原始字符串和词干标记？

您的问题是关于词干分析器令牌过滤器的"preserve_original"参数：

您会发现"preserve_original"，例如用于单词分隔符令牌过滤器，但不适用于词干标记过滤器。

如果您需要原始单词，例如用于聚合，您可以使用合适的分析器将字段复制到另一个字段。

如果您需要将原始文件放在索引的同一位置，则必须包装词干分析器并构建自己的分析器作为插件。

相关内容

最新更新

热门标签：