如何在不同区域上安装的多个Azure HDInsight(HBase)群集上运行查询



我是Azure和HBase的新手。假设我有两个HDInsight(HBase)集群,一个安装在亚洲,一个在欧洲,为来自不同国家的用户访问提供更好的读/写性能。但是如何对这些集群的所有数据运行查询?我是否需要在所有集群上分别运行查询,然后组合结果?或者还有一些内置函数,如SQL服务器的分布式查询

HBase中没有跨集群的分布式查询。在您的场景中,最好的解决方案可能是在两个hbase集群之间设置复制,然后查询其中一个集群。由于复制是异步的,两个集群中的数据将与另一个集群中过时几分钟的数据一起完成。您还可以设置更复杂的复制类型,并拥有一个单独的中心集群,该集群具有数据的超集,而另外两个集群具有各自的本地子集。

HDInsight团队正在为Azure中的复制设置编写文档。现在,您需要自己发现配置。您需要在VNet中配置集群,连接VNet,确保它们正确设置了名称解析,然后使用hbase复制设置步骤来设置复制本身:http://hbase.apache.org/book.html#_cluster_replication

如果没有复制解决方案,您将需要分别查询这两个集群。

最新更新