关于google文件系统一致性模型的几个问题



看完文章the Google File System,我还是有一些不明白的地方:

  1. "追加操作"one_answers"写操作"的优势是什么?这篇文章强调使用追加操作而不是写操作,我不知道为什么。追加比写入快?

  2. 为了保持块冗余之间的一致性,gfs使用lease让chunkserver作为主服务器,并让主服务器决定操作顺序来实现一致性,我的问题是如果重试后更新操作仍然不能成功,冗余将处于不一致状态。然后,当不同的客户端在更新失败的相同偏移量读取相同的块时,它们可能会读取不同的内容。gfs是如何处理这类问题的

  3. 如果在追加操作中发生错误,主chunkserver是否会选择一个新的偏移量来追加记录?记录是什么意思?当客户端读取文件时,如何处理文件中的填充或重复记录?

你的所有问题都在论文中直接提到了,所以你应该再仔细阅读一遍。但我会对问题的每个部分给出简短的答案,给你一个入口:

  1. 在启用并发写的同时保持一致性。如果修改现有数据,对现有数据的并发写操作会破坏一致性。

  2. 如果你只做附加,你可以随意重新排序它们,保持GFS定义的一致性模型。
  3. 作为一致性模型的一部分,它不处理这个问题。

  4. 我不明白问题的这一部分。

认为,基督教

相关内容

  • 没有找到相关文章

最新更新