websolr正在返回
RSolr::Error::Http - 400 Bad Request
Error: <html><head><title>Apache Tomcat/6.0.28 - Error report</title><style><!--H1 {font-family:Tahoma,Arial,sans-serif;color:white;background-color:#525D76;font-size:22px;} H2 {font-family:Tahoma,Arial,sans-serif;color:white;background-color:#525D76;font-size:16px;} H3 {font-family:Tahoma,Arial,sans-serif;color:white;background-color:#525D76;font-size:14px;} BODY {font-family:Tahoma,Arial,sans-serif;color:black;background-color:white;} B {font-family:Tahoma,Arial,sans-serif;color:white;background-color:#525D76;} P {font-family:Tahoma,Arial,sans-serif;background:white;color:black;font-size:12px;}A {color : black;}A.name {color : black;}HR {color : #525D76;}--></style> </head><body><h1>HTTP Status 400 - org.apache.lucene.queryParser.ParseException: Cannot parse '----': Encountered " "-" "- "" at line 1, column 1.
Was expecting one of:
"(" ...
"*" ...
<QUOTED> ...
<TERM> ...
<PREFIXTERM> ...
<WILDTERM> ...
"[" ...
"{" ...
<NUMBER> ...
当尝试搜索"-"字符时。
其他特殊的角色也很好,比如":"等等。我试过使用CGI.escape,但它无法对这些角色进行转义。
你试过用反斜杠转义它吗?
通常,当您为文档编制索引时,标记化器会自行删除短划线字符,因此您可能无论如何都只想去掉短划线,除非您希望它是一个负查询。
完整的Solr查询语法如下:http://wiki.apache.org/solr/SolrQuerySyntax
Chris正确地指出,您需要转义反斜杠。
根据您使用的查询解析器,有一些特殊字符是有意义的。在撰写本文时,Lucene(以及Solr)查询解析器为这些字符赋予了特殊的含义:
+ - && || ! ( ) { } [ ] ^ " ~ * ? :
您应该参考Lucene查询解析器语法的文档,了解它们的全部含义。默认的Solr查询解析器提供了Lucene查询解析器语法的超集,如SolrQueryParser wiki页面所述。
如果你不想担心转义,DisMax Query Parser的设计目的是接受更接近用户在搜索框中键入的输入。我最近没有针对它测试过各种特殊功能,但通常情况下,它接受的输入可能更优雅。