删除重复项而不考虑位置



是否有任何过滤器工厂可用于在不考虑位置的情况下删除重复项?

我不能使用RemoveDuplicatesTokenFilterFactory,因为它考虑位置[堆栈]。

我遇到了类似的问题,我希望它们是唯一的字段中有很多重复值。解决方案是将处理器添加到 solrconfig.xml 文件中。下面是示例。所列字段的每个值都是唯一的。我的字段名称ingredient_substance,active_moiety...

<updateRequestProcessorChain>
    <processor class="org.apache.solr.update.processor.UniqFieldsUpdateProcessorFactory">
        <lst name="fields">
            <str>ingredient_substance</str>
            <str>active_moiety</str>
            <str>generic_medicine</str>
            <str>inactive_ingredient_substance</str>
        </lst>
    </processor>
    <processor class="solr.RunUpdateProcessorFactory"/>
</updateRequestProcessorChain>

最新更新