HDFS为什么要将文件分割成块?



我试图理解HDFS将文件分割成块所获得的好处。

我希望通过并发读取多个块的并行性来提高读取性能。然而,我一直在阅读论文,说从HDFS读/写实际上比在本地文件系统上的单个文件要慢。

HDFS将文件分割成块的性能优势是什么?

我一直在阅读论文,说从HDFS读写实际上比本地文件系统上的单个文件要慢。

如果你可以在一台机器上读取文件,那么你不需要Hadoop。Hadoop是一个用于海量数据集的分布式处理框架。

HDFS将文件分成块,因为它的设计是为了处理大到无法在一台机器上处理的文件。它不是要提高小文件的处理速度,而是要给你一种方法来处理你在一台机器上无法处理的文件。

除了上述特性之外,块还非常适合用于提供容错性和可用性的复制。HDFS将每个块复制到少量物理上独立的机器上。在发生故障的情况下,只有这些块需要从它们的替代位置重新复制到其他运行的机器上。

相关内容

  • 没有找到相关文章

最新更新