如何使用Solr搜索汉字



基本上我在Drupal&使用Solr作为搜索引擎。它搜索一些简体中文单词/字符&有些人不喜欢低于

美国:为美朝峰会同朝鲜进行的磋商取得进展

它不是简单的搜索字符。

所以我检查了两个

https://lucene.apache.org/solr/guide/7_4/language-analysis.htmlhttp://www.opencms-wiki.org/wiki/Solr_-_configuration_for_Chinese_and_correct_results_for_german_umlauts

&在solr配置文件中,我在下面

<fieldType name="text_chinese" class="solr.TextField">
<analyzer class="org.apache.lucene.analysis.cn.smart.SmartChineseAnalyzer"/>
<analyzer>
<tokenizer class="solr.HMMChineseTokenizerFactory"/>
<filter class="solr.CJKWidthFilterFactory"/>
<filter class="solr.StopFilterFactory"
words="org/apache/lucene/analysis/cn/smart/stopwords.txt"/>
<filter class="solr.PorterStemFilterFactory"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
</fieldType>

它正在提供

本地:org.apache.solr.common.SolrException:org.apache.solor.common.Sol异常:无法为核心本地加载conf:的插件初始化失败[schema.xml]fieldType"text_chinese":无法加载分析器:org.apache.locene.analysiscn.smart.SmartChineseAnalyzer.Schema文件是/var/solr/cores/local/conf/schema.xml

仍然没有给出结果。

不确定配置中是否缺少什么。

错误消息告诉您Solr找不到您定义的分析器的实现类-Cannot load analyzer: org.apache.lucene.analysis.cn.smart.SmartChineseAnalyzer

SmartCN分析器默认情况下不加载,但它包含在contrib/analysis-extras/lucene-libs/lucene-analyzers-smartcn-<version number>.jar下的二进制构建中。

将该目录添加到Solr可以从solrconfig.xml加载库的目录列表中:

<lib dir="../../../contrib/analysis-extras/lucene-libs" regex=".*smartcn.*.jar" />

最新更新