在设置伪集群或全集群时,我们是否需要格式化数据节点来安装 HDFS 文件系统,或者我们只需要格式化 namenode。
我问这个是因为,我在许多博客上读到过,HDFS将数据按顺序存储在硬盘上,它是一个抽象层,将数据存储在大块上,而不是默认块大小存储提供的主机文件系统。
如果我们不格式化数据节点,那么HDFS的强大功能就会折腾。
格式化和安装硬盘驱动器与格式化HDFS没有直接关系。从概念上讲,"格式化"的想法是相同的。但这两项任务是完全分开的,没有直接关系。
Hadoop格式化命令不会格式化或装载硬盘驱动器。硬盘应已格式化并安装。当您运行 HDFS 的格式化命令时,它正在准备 NameNode fsimage 文件,以便它知道数据磁盘上所有存储块的位置。