Solr动态字段类型



我在Solr中有一个字段

<dynamicField name="Phrase_*" type="string" indexed="true" stored="true" multiValued="true" required="false"/>

用于保存不同语言中的短语,因此名称往往是"Phrase_en","Phrase_sp"等。我有分析器和过滤器来处理以类似方式命名的类型("string_en","string_sp"等)的不同语言字段,这些字段对相应的语言进行正确的词干提取/同义词处理,我想找到一些方法将其组合起来,以便根据字段名称为每种语言使用正确的分析器/过滤器集。

目前,我唯一能想到的就是创建一个类型,将这些分析集多路复用,并判断将其发送到哪一个,但我不知道如何做到这一点。

关于如何实现这一目标,或者实现这一目标的更好方法,有什么想法吗?

这个问题在Solr in Action一书中(强烈推荐给那些希望深入了解Solr配置的人)和其他试图达到相同结果的人中有相当详细的介绍。有三种基本方法:

  1. 每个语言单独的字段-加载到单独的字段(不是
  2. 为每种语言提供适当的标记器和过滤器
  3. 每种语言单独索引/核心-
  4. 所有内容在一个字段中,自定义管理代码-

你的建议是1和3的变体-我能给你的最好的地方是开始阅读有问题的书(它在第14章),并研究他放在Github上实现它的代码:

https://github.com/treygrainger/solr-in-action/tree/master/src/main/java/sia/ch14https://github.com/treygrainger/solr-in-action/tree/master/example-docs/ch14/cores

最新更新