用Cassandra评估最小存储磁盘大小



我正在执行不同Parquet模式和不同Cassandra表布局之间的分析/比较。

其中一个输出是磁盘的存储空间大小。

我想确保我对Cassandra是公平的,所以我想确保快照被删除,并且压缩被"完全"运行。

我的数据最初是在Parquet中,我用Spark SQL读取它,有一个大数据框架,然后我使用Spark- cassandra连接器将其写入C*。

我应该运行什么类型的"命令"(我假设使用nodetool)来删除快照,运行压缩,然后获得表的磁盘大小的精确数字?

你必须执行nodetool clearsnapshot

该命令只删除nodetool命令所指向的节点上的快照。所以你必须在每个节点上做。

https://docs.datastax.com/en/cassandra/3.x/cassandra/tools/toolsClearSnapShot.html

https://docs.datastax.com/en/cassandra/3.x/cassandra/operations/opsBackupDeleteSnapshot.html?hl=clearsnapshot

最新更新