我这里有一个关于从 hbase 加载数据时如何过滤行键的问题,现在我一直在这样做
pigServer.registerQuery("$result = LOAD 'hbase://reach.${campaign.appId}' "
+ "USING org.apache.pig.backend.hadoop.hbase.HBaseStorage('data:queued data:dropped', "
+ "'-loadKey -gte=key1 -lte=key20') "
但这只允许我获得一个范围的键,从key1到key20,我想要的是能够精确键,而不是键的范围,例如我只想要键3,键5,键7....
有没有像"过滤依据...."或者我们可以这样使用?谢谢!
目前没有办法用HBaseStorage做到这一点,但请查看 http://phoenix.apache.org。您可以执行 IN 查询,该查询使用跳过扫描来非常有效地返回单个键的列表。