HBase MapReduce相互作用



我有一个程序hbase和mapreduce。

i将数据存储在HDF中,此文件的大小为:100G。现在我将这些数据放在HBase中。

我使用MapReduce扫描此文件损失了5分钟。但是要扫描hbase表损失了30分钟。

使用HBase和MapReduce时如何提高速度?

谢谢。

我假设您有一个节点HDF。如果您将100GB文件放在HDF的多节点群集中,那么对于MAP DYDEB和HIVE而言,它的速度要快得多。

您可以尝试增加地图上的映射器和还原器减少以提高性能,看看这篇文章。

Hive本质上是一种基于HDF顶部的数据仓库工具,每个查询都在下面是地图减少任务本身。因此,上面的帖子也会回答此问题。

最新更新