我们有两个系统——一个离线系统(性能在这里并不重要),其中MapReduce作业在HBase集群上运行。另一个是在线系统(Performace在这里非常关键),其中API从同一个HBase集群读取。但是由于MapReduce作业在同一集群上运行,因此在线系统上存在性能问题。因此,我们正在尝试为脱机系统设置单独的HBase群集,这是从源群集复制几个系列名称。所以在源繁重的MapReduce作业上运行。在复制的群集上,只有联机系统运行,以提供最佳性能。我在这里的问题是:: 我们不能在 HBase 中使用快照功能来做同样的事情吗?我还想知道它们之间有什么区别?
如果您将快照功能用于mapreduce,它还会在实时HBASE集群节点上花费CPU,内存和磁盘IO。因此,如果磁盘io或cpu是你的瓶颈,那么为mapreduce作业单独集群是更好的解决方案。