是否有可能限制不良查询对Hbase集群的影响?
如果是,需要实现哪些目标?
我是否需要kerberos来识别用户并限制他们的查询影响或为他们分配资源?
来自phoenix的糟糕查询可能会杀死整个Hbase集群,这是我真正想要改变的。我将非常感谢任何关于这个话题的提示。
我们在Splice Machine 2.0之前的版本中运行OLAP查询时遇到了类似的问题。在2.0中,我们引入了一个在Spark上实现的新执行引擎,它使用混合扫描器直接从HFiles读取数据,并将其与来自HBase Memstore的数据合并,使我们能够将如此大的扫描对区域服务器的影响降到最低,因为我们只访问HBase的内存数据。
您可以查看我们如何在我们的存储库中实现它。主要的类是SplitRegionScanner和MemstoreAwareObserver。