我对HDFS的高可用性和名称节点感到困惑,这两件事是一样的还是不同的?
或多或少,当NameNode在标准集群中关闭(这是一个单点故障(时,所有HDFS集群都将关闭,因为基本上没有其他角色/节点可以取代它的工作。因此,当我们说HDFS高可用性时,我们说的是创建另一个备用NameNode,以在活动节点关闭后替换它。
因此,为了回答您的问题,我可以说是的,您可以称之为">HDFS NameNode High Availability"、">HDFS HA,">NameNode HA'。。你们指向的是相同的东西"当NameNode主机关闭时,使HDFS集群工作"。
HDFS是Hadoop项目中的一个分布式文件系统。HDFS处理分布式存储,即在集群节点之间以块的形式存储数据。
HDFS是主从结构。它有一个或多个主节点,即NameNode和一个或更多从属节点,即DataNodes
HDFS有两种类型的数据:
- 元数据-由NameNode管理
- 数据-由DataNodes管理
在HDFS中,元数据在存储方面发挥着重要作用;实际数据的检索。因此,NameNode的可用性对整个集群的健康状况非常重要。
为了使NameNode高度可用,HDFS引入了HDFS高可用性或NameNode可用性
注意:HDFS HA和NameNode HA是相同的主题
HDFS High Availability提供了在同一集群中以主动/被动配置运行两个NameNodes的选项。
我的理解是,两者都指同一现象。
您可以通过参考此处的Cloudera文档来获得更好的理解。