是否有任何过滤器工厂可用于在不考虑位置的情况下删除重复项?
我不能使用RemoveDuplicatesTokenFilterFactory,因为它考虑位置[堆栈]。
我遇到了类似的问题,我希望它们是唯一的字段中有很多重复值。解决方案是将处理器添加到 solrconfig.xml 文件中。下面是示例。所列字段的每个值都是唯一的。我的字段名称ingredient_substance,active_moiety...
<updateRequestProcessorChain>
<processor class="org.apache.solr.update.processor.UniqFieldsUpdateProcessorFactory">
<lst name="fields">
<str>ingredient_substance</str>
<str>active_moiety</str>
<str>generic_medicine</str>
<str>inactive_ingredient_substance</str>
</lst>
</processor>
<processor class="solr.RunUpdateProcessorFactory"/>
</updateRequestProcessorChain>