具有多个筛选条件的 HBase 扫描 API



我对HBase api很陌生,在执行以下操作时看到了一些奇怪的结果。

我们正在尝试基于多个过滤器进行扫描。我想通过所有筛选条件。 我正在使用下面的代码。

FilterList filterList = new FilterList(FilterList.Operator.MUST_PASS_ALL);
Filter pageFilter = new PageFilter(5000);
filterList.addFilter(pageFilter);
SingleColumnValueFilter filterOne = new SingleColumnValueFilter(Bytes.toBytes(COLUMN_FAMILY),
                Bytes.toBytes(COLUMN_NAME1), CompareOp.EQUAL, Bytes.toBytes(value1));
filterList.addFilter(filterOne);
SingleColumnValueFilter filterTwo = new SingleColumnValueFilter(Bytes.toBytes(COLUMN_FAMILY),
                Bytes.toBytes(COLUMN_NAME2), CompareOp.EQUAL, Bytes.toBytes(value2));
filterList.addFilter(filterOne);
filterList.addFilter(filterTwo);
//Scan
Scan scan = new Scan();
scan.setFilter(filterList);
Result result;
try {
            scanner = hTable.getScanner(scan);
        } catch (IOException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }
while ((result = scanner.next()) != null) {
  //print the result.
}
//If I am adding multiple SingleColumnValueFilter and I am not doing a addCoulmn() to the scan I am not getting any result even though there are records.
//If I am adding a column to scan then I am seeing results. Initially the result set is matching my filter condition but if I am running for bigger hbase data set then I am seeing bad results.
//If I am adding multiple addCoulmn() to my scan then I am not seeing any result

我试图寻找合适的例子,但它们似乎都没有奏效。非常感谢这方面的任何帮助。提前谢谢。

您指定了一个所有筛选器都必须通过的FilterList(如"AND"行为)。在过滤器列表中,您有 2 个矛盾SingleColumnValueFilter:他们说列COLUMN_FAMILY:COLUMN_NAME必须同时等于 value1 和 value2。我认为这就是为什么您没有在第 1 条和第 3 条评论的上下文中得到结果的原因。

关于您的第二条评论,我认为您必须记住,仅当扫描中存在该列时,才会应用SingleColumnValueFilter。这可能是你所看到的解释。检查setFilterIfMissing(boolean)方法:https://hbase.apache.org/apidocs/org/apache/hadoop/hbase/filter/SingleColumnValueFilter.html#setFilterIfMissing-boolean-

希望对你有帮助

最新更新