我正在阅读Google文件系统上发表的论文,发现GFS支持在现有文件的任意位置进行追加和更新。
据我所知,HDFS不支持更新操作,因为它旨在实现一次写入和多次读取的功能。HDFS现在确实支持追加操作。对于最新版本,它们将 dfs.support.append 默认设置为 false。
所以我的问题是有什么方法可以进行某种更新操作。我试过寻找,但我发现 HDFS 不支持更新操作。
希望尽快收到您的来信。
仅供参考:我读过很多关于克劳德拉和其他关于这个的帖子。我能够在Hadoop贡献者的一些博客中找到HDFS确实支持更新操作的可能性。但是没有人提到或确切地说明它是如何进行更新操作的。
当前的主要版本Apache Hadoop 2.0提供了几个重要的HDFS改进,包括新的append-pipeline。您可以在追加设计文档中找到详细信息。这些是相关的门票:
哈杜普-1700
高密度纤维板-265
顺便说一句,我也尝试在 1.x 上追加。它有效,但不安全。