休眠搜索分析器进行排序

在Hibernate Search 5.3上，我一直在尝试构建一个分析器，该分析器适用于对通过Hibernate搜索索引的许多字段进行排序。我知道对于排序不应该分析字段，但只要您的分析器返回单个标记，我相信这没有问题，此外，您可以使用一些预构建的过滤器来不区分大小写、HTML 剥离，就我而言，我也只想按前 20 个字符排序。

所以，这样的事情似乎会起作用。

@AnalyzerDef(name = "sortAnalyzer", 
    tokenizer = @TokenizerDef(factory = KeywordTokenizerFactory.class) ,        
    charFilters = { @CharFilterDef(factory = HTMLStripCharFilterFactory.class) },
    filters = 
            { 
                @TokenFilterDef(
                        factory = EdgeNGramFilterFactory.class,
                        params = {
                          @Parameter(name = "minGramSize",value = "20"),
                          @Parameter(name = "maxGramSize",value = "20")
                        }
                    ),                  
                @TokenFilterDef(factory = LowerCaseFilterFactory.class),
                @TokenFilterDef(factory = TrimFilterFactory.class)
            }
        ),

但它只有在我删除 EdgeNGramFilterFactory 时才有效。我想我可以做一个桥来做子字符串。再说一次，我可以使用桥来完成整个事情并设置 Analyze.NO。我的问题是推荐什么？与分析仪相比，电桥有什么优势吗？

我尝试使用的分析器不起作用的原因是什么？

EdgeNGramFilterFactory 将创建多个令牌，因此这将违反"单个令牌"的原则。所以这就是它不起作用的原因。

通常，当需要应用标记化并对属性进行排序时，解决方案是将属性索引为多个字段。

请参阅@Fields注释：

@Fields({
   @Field(name="sortable_something",analyzer=@Analyzer(definition="sortable_html_key")),
   @Field(name="something",analyzer=@Analyzer(definition="html_ngrams_key"))
})
public String getSomething() {

相关内容

最新更新

热门标签：