在Websolr中搜索"-"

  • 本文关键字:搜索 Websolr websolr
  • 更新时间 :
  • 英文 :


websolr正在返回

 RSolr::Error::Http - 400 Bad Request
Error: <html><head><title>Apache Tomcat/6.0.28 - Error report</title><style><!--H1 {font-family:Tahoma,Arial,sans-serif;color:white;background-color:#525D76;font-size:22px;} H2 {font-family:Tahoma,Arial,sans-serif;color:white;background-color:#525D76;font-size:16px;} H3 {font-family:Tahoma,Arial,sans-serif;color:white;background-color:#525D76;font-size:14px;} BODY {font-family:Tahoma,Arial,sans-serif;color:black;background-color:white;} B {font-family:Tahoma,Arial,sans-serif;color:white;background-color:#525D76;} P {font-family:Tahoma,Arial,sans-serif;background:white;color:black;font-size:12px;}A {color : black;}A.name {color : black;}HR {color : #525D76;}--></style> </head><body><h1>HTTP Status 400 - org.apache.lucene.queryParser.ParseException: Cannot parse '----': Encountered &quot; &quot;-&quot; &quot;- &quot;&quot; at line 1, column 1.
Was expecting one of:
   &quot;(&quot; ...
   &quot;*&quot; ...
   <QUOTED> ...
   <TERM> ...
   <PREFIXTERM> ...
   <WILDTERM> ...
   &quot;[&quot; ...
   &quot;{&quot; ...
   <NUMBER> ...

当尝试搜索"-"字符时。

其他特殊的角色也很好,比如":"等等。我试过使用CGI.escape,但它无法对这些角色进行转义。

你试过用反斜杠转义它吗?

通常,当您为文档编制索引时,标记化器会自行删除短划线字符,因此您可能无论如何都只想去掉短划线,除非您希望它是一个负查询。

完整的Solr查询语法如下:http://wiki.apache.org/solr/SolrQuerySyntax

Chris正确地指出,您需要转义反斜杠。

根据您使用的查询解析器,有一些特殊字符是有意义的。在撰写本文时,Lucene(以及Solr)查询解析器为这些字符赋予了特殊的含义:

+ - && || ! ( ) { } [ ] ^ " ~ * ? : 

您应该参考Lucene查询解析器语法的文档,了解它们的全部含义。默认的Solr查询解析器提供了Lucene查询解析器语法的超集,如SolrQueryParser wiki页面所述。

如果你不想担心转义,DisMax Query Parser的设计目的是接受更接近用户在搜索框中键入的输入。我最近没有针对它测试过各种特殊功能,但通常情况下,它接受的输入可能更优雅。

相关内容

  • 没有找到相关文章

最新更新