为什么Hadoop不支持关系数据库



Hadoop System的Nosql数据库支持。

我可以知道为什么Hadoop系统不支持关系数据库。

如何管理大型关系数据库?

以下是

Hadoop和RDBMS之间的区别:

  • Hadoop不支持原子性,一致性,隔离性,和耐用性。
  • Hadoop中无法实现低延迟的数据检索,这与RDBMS。无法保证Hadoop需要多少时间完成作业。
  • 基本上,Hadoop具有更快的写入速度,RDBMS具有更快的读取速度。更快读取是因为使用了B树数据结构进行存储。
  • Hadoop没有模式。RDBMS有一个模式。

您可以使用hive,pig,HBase等查询存储在HDFS中的大型结构化数据,但检索速度不会像RDBMS那样快。我的观点是不要使用Hadoop进行关系操作。

RDBMS可以存储高达几TB的数据,续订许可证总是很痛苦。

例如:SQL,MySQL

MPP(大规模并行处理)来了。MPP系统可以处理比RDBMS数据库的单个节点更大的数据,因为它将数据存储在集群中。但有一个限制。

例如:Netezza,Teradata等

上面提到的RDBMS和MPP可以处理高达一些TB的结构化数据,并提供快速响应......可用于OLTP。

最后是我们的Hadoop..,它主要用于处理大量(PB)的数据,同时在可扩展的商品硬件上进行存储和处理。Hadoop不适用于OLTP。

最新更新