如何在重新生成操作后验证数据是否同步



>我在 dc-1 中有一个 cassandra 集群,现在我已经将我的集群扩展到 dc-2 并扩展了所有密钥空间,然后运行

nodetool rebuild dc-1

在 DC-2 中的所有节点上。现在有没有办法验证 dc-1 中的所有数据是否都复制到 dc-2 ?

我正在使用 3.11.x 版本的卡桑德拉

如果你有应用程序不断地将数据写入Cassandra数据库,这很难做到,因为两个数据中心的数据总是会略有不同,由动态数据等产生。

理论上,您可以使用 Spark 和自定义选项指向特定数据中心,并有一个查询,该查询将数据加载到某个特定时间戳(基于数据库本身的数据,因此仅在具有此类字段的表上(,然后比较两个数据帧。

但坦率地说,复制是Cassandra的主要功能,如果你定期执行修复(建议使用Reaper(,那么你应该有数据同步。

最新更新