我正在执行不同Parquet模式和不同Cassandra表布局之间的分析/比较。
其中一个输出是磁盘的存储空间大小。
我想确保我对Cassandra是公平的,所以我想确保快照被删除,并且压缩被"完全"运行。
我的数据最初是在Parquet中,我用Spark SQL读取它,有一个大数据框架,然后我使用Spark- cassandra连接器将其写入C*。
我应该运行什么类型的"命令"(我假设使用nodetool
)来删除快照,运行压缩,然后获得表的磁盘大小的精确数字?
你必须执行nodetool clearsnapshot
该命令只删除nodetool
命令所指向的节点上的快照。所以你必须在每个节点上做。