我是这方面的新手。想知道hadoop分布式文件系统和网络文件系统之间的基本区别吗?hdfs比nfs有什么好处?
首先让我们从一些定义开始。
NFS(网络文件系统):开发的一种协议,允许客户端通过网络访问文件。NFS客户端允许访问文件,就好像文件位于本地计算机上一样,即使它们位于网络计算机的磁盘上。
HDFS(Hadoop分布式文件系统):分布在许多联网计算机或节点之间的文件系统。HDFS是容错的,因为它在文件系统上存储文件的多个副本,默认的复制级别是3。
那么最大的区别是什么复制/容错。HDFS是为在故障中幸存而设计的。NFS没有内置任何容错功能。
NFS上的HDFS有哪些好处除了容错之外,HDFS还支持文件的多个副本。这消除了(或缓解了)许多客户端访问单个文件的常见瓶颈。由于文件在不同的物理磁盘上有多个副本,因此读取性能比NFS扩展得更好。
注意:Hadoop提供了NFSGateway来弥补这种差异