我使用以下设置来创建 ES 索引。
"settings": {
"analysis" : {
"analyzer" : {
"my_analyzer" : {
"tokenizer" : "standard",
"filter" : ["standard", "lowercase", "my_stemmer"]
}
},
"filter" : {
"my_stemmer" : {
"type" : "stemmer",
"name" : "english"
}
}
}
}
我注意到,在分析时,词干分析器用词干词替换了原始字符串。有没有办法同时索引原始字符串和词干标记?
您的问题是关于词干分析器令牌过滤器的"preserve_original"参数:
您会发现"preserve_original",例如用于单词分隔符令牌过滤器,但不适用于词干标记过滤器。
如果您需要原始单词,例如用于聚合,您可以使用合适的分析器将字段复制到另一个字段。
如果您需要将原始文件放在索引的同一位置,则必须包装词干分析器并构建自己的分析器作为插件。