有没有像HDFS的DataBlockScanner for Cassandra这样的东西,即检查不经常读取的损坏数据的自动机制?
No.
Cassandra不会自动执行此操作 - 它可以保证一致性 通过一致性级别读取或写入每个查询,并且可以主动运行 (反熵)修复。但必须安排主动维修(由人工或 cron 或通过第三方脚本(如 http://cassandra-reaper.io/),以及 迂腐,修复只能解决一致性问题,还有一些工作要做 完成以正确处理/支持修复损坏的副本(例如, 修复可以将从一个节点发送到所有其他节点的位翻转)
http://mail-archives.apache.org/mod_mbox/cassandra-user/201709.mbox/%3CCABNXB2CWXqvR_zkGSGfw7DJjU+Emer3a0Dcv0YkHUtKBEc1e+A@mail.gmail.com%3E
大数据就像垃圾桶。凉。
最好的办法是使用nodetool verify
将马厩的哈希值与内容进行比较。特别是nodetool verify -e
走单个细胞。
https://docs.datastax.com/en/cassandra/3.0/cassandra/tools/toolsVerify.html