卡桑德拉 压缩分区的最大字节大小大于用于表的总空间



我正在研究Cassandra版本2.1.13.1218和cqlsh版本5.0.1。

对于给定的表,当我运行cfstats命令时,压缩分区最大字节数大于已用空间(总计)。例如:

Compacted partition maximum bytes: 4.64 MB

Space used (total): 2.28 MB.

使用的总空间应始终较高,因为所有大/小分区大小都是给定表总空间的一部分。压缩分区的最大字节大小如何大于表使用的总空间?

命令为:./cqlsh cfstats keyspace.columnfamilyname -H

有人可以帮助我理解这一点,已用空间(实时)和已用空间(总计)之间有什么区别?

已用空间表示磁盘上的表使用了多少空间。这取决于操作系统和压缩率。而压缩分区的最大字节数只是遇到的最大分区大小(压缩后)。这基于使用的数据建模/架构和逻辑记录大小。例如,100kb 记录大小乘以 40 条记录(每条记录进入同一分区)将为您提供 4MB 的分区。

当它位于磁盘上时,这可能会进一步压缩,您可能会在磁盘上获得 2MB。您也可以分享其余的统计数据(例如、最小和平均大小的压缩信息、键数)吗?

最新更新