NameNode的高可用性(HA)和HDFS之间有什么区别吗



我对HDFS的高可用性和名称节点感到困惑,这两件事是一样的还是不同的?

或多或少,当NameNode在标准集群中关闭(这是一个单点故障(时,所有HDFS集群都将关闭,因为基本上没有其他角色/节点可以取代它的工作。因此,当我们说HDFS高可用性时,我们说的是创建另一个备用NameNode,以在活动节点关闭后替换它。

因此,为了回答您的问题,我可以说是的,您可以称之为">HDFS NameNode High Availability"、">HDFS HA,">NameNode HA'。。你们指向的是相同的东西"当NameNode主机关闭时,使HDFS集群工作"。

HDFS是Hadoop项目中的一个分布式文件系统。HDFS处理分布式存储,即在集群节点之间以块的形式存储数据。

HDFS是主从结构。它有一个或多个主节点,即NameNode和一个或更多从属节点,即DataNodes

HDFS有两种类型的数据:

  • 元数据-由NameNode管理
  • 数据-由DataNodes管理

在HDFS中,元数据在存储方面发挥着重要作用;实际数据的检索。因此,NameNode的可用性对整个集群的健康状况非常重要。

为了使NameNode高度可用,HDFS引入了HDFS高可用性NameNode可用性

注意:HDFS HA和NameNode HA是相同的主题

HDFS High Availability提供了在同一集群中以主动/被动配置运行两个NameNodes的选项。

我的理解是,两者都指同一现象。

您可以通过参考此处的Cloudera文档来获得更好的理解。

相关内容

  • 没有找到相关文章

最新更新