-
区域服务器在哪里存在?是带有数据节点还是区域服务器,区域存在于不同的硬件中。
-
WAL是否由表的数据和操作组成?
-
Memstore做什么?它将WAL的数据与数据一起存储?
-
Zookeeper实际做什么?
希望下面的信息会有所帮助:
-
从技术上讲,在Hadoop群集中存在的区域服务器。区域存储在HDFS中。
-
客户端向hregionserver发出htable.put(put)请求,该请求将详细信息传递给匹配的hregion实例。第一步是将数据写入Writeahead Log(WAL),以HLOG类代表。
-
一旦将数据写入WAL,它就会放置在模式中。同时,检查了以查看备忘录是否已满,如果是的,请要求进行齐平。该请求由Hregionserver中的一个单独线程提供,该线程将数据写入HDFS中的新HFILE。
-
Zookeeper协调客户端和HBase群集之间的通信。
1.数据节点位于同一位置的区域服务器。他们响应将数据存储为HDFS中的3个副本。
2.WAL是类似于事务日志INSQL Server,它会扰乱所有操作并在存储时执行其操作(在存储时发生故障(在丢失的数据中,它将作为备份提供)。
3.在最初将数据存储到WAL中,然后在达到MEMSTORE的限制(阈值级别)时将数据融合到Memstore。
4. IT存储-.root.-由集群信息组成的表,它在读取数据时有助于客户端。IE:它提供了向客户端找到数据的路径。