这种查询语言叫什么



据我所知,Apache Lucene和Google(GSA或GCS(是完全不同的搜索引擎/框架,它们的解析器具有不同的逻辑,但它们的查询语言看起来非常相似,或者相同。如果它们相同,那么这种查询语言叫什么?如果不一样,每个叫什么/有什么区别?

例:

field1:foo "some text"

并且项目存在于数据集中

{
"field1": "foo",
"somefield": "bla bal some text"
}

将在结果中

你可以称之为"搜索语法",它是旧时代信息检索研究(80年代和90年代(的混搭,以及90年代后期突然占主导地位的网络搜索引擎所确定的。

现代面向客户的搜索引擎在所有字段中匹配查询中的所有单词,尽管有些允许部分匹配。 大多数都允许使用查询语法覆盖默认行为的方法,例如布尔运算符,如 AND(有时为"+"(、OR(有时为"||"(和 NOT(有时为"_"(、引号以指示短语搜索匹配项,以及字段筛选器(如"Department:"(。

毕竟,我突然想到您可能来自数据库背景,并询问为什么结果与查询不完全匹配。 如果是这种情况,那是因为搜索引擎有一个倒排索引,可以匹配部分字段,然后通过相关性算法(通常是 TF IDF(对结果进行排序。

相关内容

  • 没有找到相关文章

最新更新