ElasticSearch - Using FilterBuilders



我是ElasticSearch和Couchbase的新手。我正在构建一个示例Java应用程序,以了解更多关于ElasticSearch和Couchbase的知识。

阅读ElasticSearch Java API,过滤器更好地用于不需要按分数排序和缓存的情况。我还没有弄清楚如何使用FilterBuilders,并有以下问题:

  • FilterBuilders可以单独使用搜索吗?
  • 或者它们总是必须与Query一起使用吗?(如果是真的,谁能举个例子?)
  • 通过文档,如果我想执行基于字段值的搜索并想使用FilterBuilders,我该如何完成?(使用AndFilterBuilderTermFilterBuilderInFilterBuilder ?我不清楚它们之间的区别)

对于第三个问题,我实际上使用查询和过滤器进行了搜索测试,如下所示。当我尝试使用FilterBuilders搜索时,我得到了空结果(没有行)。我不知道我做错了什么。

任何例子都会有帮助。我有一段艰难的时间通过文档,我发现稀疏,甚至搜索导致各种不可靠的用户论坛。

private void processQuery() {
        SearchRequestBuilder srb = getSearchRequestBuilder(BUCKET);
        QueryBuilder qb = QueryBuilders.fieldQuery("doc.address.state", "TX");
        srb.setQuery(qb);
        SearchResponse resp = srb.execute().actionGet();
        System.out.println("response :" + resp);
    }
private void searchWithFilters(){
        SearchRequestBuilder srb = getSearchRequestBuilder(BUCKET);
        srb.setFilter(FilterBuilders.termFilter("doc.address.state", "tx"));
        //AndFilterBuilder andFb = FilterBuilders.andFilter();
        //andFb.add(FilterBuilders.termFilter("doc.address.state", "TX")); 
        //srb.setFilter(andFb);
        SearchResponse resp = srb.execute().actionGet();
        System.out.println("response :" + resp);
    }

- - update -

如答案所示,将其改为小写的"tx"即可。这个问题解决了。我还有以下问题:

  • 在什么情况下,过滤器与查询一起使用?这样做的目的是什么?
  • InFilterTermFilterMatchAllFilter的差值。任何插图都会有帮助。

正确,您应该使用过滤器在执行查询时排除文档。过滤器更快,因为它们不涉及任何评分,并且可以缓存。

也就是说,很明显,您必须在搜索api中使用过滤器,它执行查询并接受可选的过滤器。如果您只有一个过滤器,您可以将match_all查询与过滤器一起使用。过滤器可以是简单过滤器,也可以是复合过滤器,以便将多个过滤器组合在一起。

关于Java API,使用的名称是可用的过滤器的名称,没有太大的区别。看一下这个搜索示例。在你的代码中,我看不到你在SearchRequestBuilder对象上做setFilter的地方。您似乎也不需要and过滤器,因为您使用的是单个过滤器。此外,您可能正在使用默认映射进行索引,因此术语"TX"是小写的。这就是为什么使用术语过滤器进行搜索时找不到任何匹配项的原因。试着搜索小写的"tx"

你可以改变你的映射,如果你想保持"TX"术语,因为它是在索引,可能设置字段为not_analyzed,如果它应该只有一个令牌。否则,您可以更改过滤器,您可能想要查看被分析的查询,以便您的查询将以与内容索引相同的方式进行分析。

查看查询DSL文档,了解有关查询和过滤器的更多信息:

  • MatchAllFilter:匹配你所有的文档,不是那么有用,我想说
  • TermFilter:过滤包含术语(未分析)字段的文档
  • AndFilter:复合过滤器,用于放置两个或多个过滤器

不知道你说的InFilterBuilder是什么意思,找不到这个名字的过滤器

查询通常包含用户通过文本搜索框输入的内容。过滤器是优化搜索的更多方法,例如单击facet条目。这就是为什么您仍然需要查询加上一个或多个过滤器。

添加到@javanna所说的:

过滤器可以用几种方式定义,这可能会引起很多混淆:

  • 独立(与必要的查询,例如match_all,如果你需要的只是过滤器)(http://www.elasticsearch.org/guide/reference/api/search/filter/)
  • 或作为过滤查询的一部分(http://www.elasticsearch.org/guide/reference/query-dsl/filtered-query/)

你可能会问有什么不同。实际上,你可以用两种方法构造完全相同的逻辑。

不同之处在于查询既对结果集操作,也对您定义的任何facet操作。然而,过滤器(当单独定义时)只操作结果集,而不操作您可能已经定义的任何方面(在这里解释:http://www.elasticsearch.org/guide/reference/api/search/filter/)

添加到其他答案中,InFilter仅与FilterBuilders一起使用。定义是:InFilter:一个基于匹配其中任何一个的几个词的字段的过滤器。

查询Java API使用FilterBuilders,它是过滤器构建器的工厂,可以从Java代码动态创建查询。我们使用表单来实现这一点,并基于用户从表单中选择的复选框、选项和下拉框来构建查询。

下面是一些FilterBuilders的示例代码,其中有一个使用InFilter的链接片段,如下所示:

FilterBuilder filterBuilder;
    User user = (User) auth.getPrincipal();
    if (user.getGroups() != null && !user.getGroups().isEmpty()) {
        filterBuilder = FilterBuilders.boolFilter()
                .should(FilterBuilders.nestedFilter("userRoles", FilterBuilders.termFilter("userRoles.key", auth.getName())))
                .should(FilterBuilders.nestedFilter("groupRoles", FilterBuilders.inFilter("groupRoles.key", user.getGroups().toArray())));
    } else {
        filterBuilder = FilterBuilders.nestedFilter("userRoles", FilterBuilders.termFilter("userRoles.key", auth.getName()));
    }
    ...

最新更新