>我在 dc-1 中有一个 cassandra 集群,现在我已经将我的集群扩展到 dc-2 并扩展了所有密钥空间,然后运行
nodetool rebuild dc-1
在 DC-2 中的所有节点上。现在有没有办法验证 dc-1 中的所有数据是否都复制到 dc-2 ?
我正在使用 3.11.x 版本的卡桑德拉
如果你有应用程序不断地将数据写入Cassandra数据库,这很难做到,因为两个数据中心的数据总是会略有不同,由动态数据等产生。
理论上,您可以使用 Spark 和自定义选项指向特定数据中心,并有一个查询,该查询将数据加载到某个特定时间戳(基于数据库本身的数据,因此仅在具有此类字段的表上(,然后比较两个数据帧。
但坦率地说,复制是Cassandra的主要功能,如果你定期执行修复(建议使用Reaper(,那么你应该有数据同步。