名称节点如何更新Hadoop中HDFS写入数据节点的可用性



我有10个数据节点,复制因子为3,文件大小为150,块大小为64。所以文件将被分成三个块B1,B2,B3。因此,客户端向Name Node询问写入B1块的Data节点的可用性。我的问题是,有多少数据节点将通过Name节点提供给客户端用于写入B1块。还有一个问题是,B1、B2、B3的写入将如何并行或顺序发生

  1. 客户端只将数据写入一个数据节点,其余复制由数据节点本身根据namenode指令进行。Replica placement:当数据节点从客户端接收块的数据时,数据节点将数据保存在代表块的文件中,同时将数据重新发送到另一个数据节点,该数据节点应该创建块的另一个副本。

  2. 块按顺序复制

最新更新