索尔 精确匹配提升 减少结果



我有两个字段,一个是复制字段。

  1. <field name="product_name" type="text_wslc" indexed="true" stored="true" required="true" multiValued="false"/>

  2. <field name="dummy_name" type="string_ci" indexed="true" stored="false" required="true" />

其定义如下

<fieldType name="text_wslc" class="solr.TextField" sortMissingLast="true" omitNorms="true">
<analyzer type="query">
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
<filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
 <filter class="solr.WordDelimiterFilterFactory"
                                 generateWordParts="1"
                                 generateNumberParts="1"
                                 catenateWords="1"
                                 catenateNumbers="1"
                                 catenateAll="1"
                                 preserveOriginal="1"
                                 />
    <filterclass="solr.LowerCaseFilterFactory"/>
<filter class="solr.SnowballPorterFilterFactory" language="English" />
                    <filter class="solr.PorterStemFilterFactory"/>
                    <filter class="solr.KStemFilterFactory"/>
                    <filter class="solr.EnglishMinimalStemFilterFactory"/>
                            </analyzer>

    <fieldType name="string_ci" class="solr.TextField" sortMissingLast="true" omitNorms="true">
          <analyzer type="query">
        <tokenizer class="solr.KeywordTokenizerFactory"/>
            <filter class="solr.LowerCaseFilterFactory"/>
            <filter class="solr.SnowballPorterFilterFactory" language="English" />
            <filter class="solr.KStemFilterFactory"/>
            <filter class="solr.EnglishMinimalStemFilterFactory"/>
        </analyzer>
    </fieldType>

提交的副本是首先获得完全匹配的结果。我的查询是这样的

/select?q=("laptop+bag")&df=product_name&defType=edismax&qf=dummy_name^20000+product_name^0.01

它给了我大约 8000 个结果

但实际结果在20000左右

 /select?q=(laptop+bag)&df=product_name&defType=edismax&qf=dummy_name^20000+product_name^0.01 

但它不会首先列出确切的结果。如何解决此问题?我的查询有问题吗?这是我的字段和定义

你这里有几件事要做。

首先,搜索"笔记本电脑包"和笔记本电脑包是两回事,这就是为什么你会得到不同的结果。第一个将搜索确切的短语,而后者将找到任何关键字。因此,当您的搜索查询周围有引号时,您看到的结果较少是有道理的。

其次,我认为你对string_ci领域的领域定义需要一些调整,在这一点上,你的词干意图对我来说有点神秘。此外,请确保您的索引设置和该字段的查询设置相对相似。使用Solr管理UI分析器调整字段,并查看更改如何影响数据输入/输出。

最后,您发布的最后一个字段配置没有字段标签。总的来说,很难说问题具体在哪里。我建议从运行一些查询开始,并将 debug 设置为 true,以查看如何评估相关性。我敢打赌,字符串字段的索引和查询参数不一致。如果确实如此,则可以在管理 UI 分析器中验证这一点。

祝你好运弄清楚这一点。

相关内容

  • 没有找到相关文章

最新更新