从solr doc (lucene, luke)中检索分析过的带状疱疹



我创建了一个solr字段,如下所示:

<analyzer type="index">
    <tokenizer class="solr.LowerCaseTokenizerFactory"/>              
    <filter class="solr.StopFilterFactory" words="stopwords.txt" ignoreCase="true"/>
    <filter class="solr.ShingleFilterFactory" minShingleSize="3" maxShingleSize="5"/>
    <filter class="solr.PatternReplaceFilterFactory" pattern=".*_.*" replacement=""/>
</analyzer>

它创建具有预期结果的文档。我想得到我无法找到的特定过滤器查询的所有瓦片。我试着使用卢克来获取索引,但是,它给了我所有的带状疱疹,而不是从过滤器查询。有没有可能得到这样的数据?

根据该字段进行Faceting将为您提供所有令牌以及令牌出现的次数。这可能就足够了。

如果您这样做是为了测试单个输入,您也可以在Web管理UI的分析屏幕中尝试。

最新更新