对于更新最少的表,建议使用哪种压缩策略



我正在为具有以下特征的数据寻找压缩策略

  1. 我们不需要60-90天后的数据。在极端情况下,可能需要180天
  2. 理想情况下,插入会发生,更新永远不会发生,但预期会导致更新的重复事件是现实的
  3. 如果你仔细想想,它是间接的时间序列数据,首先发生的事件将首先存储,一旦存储了事件,它几乎永远不会被修改,除非发布重复的事件

哪种策略最适合这种情况?

TimeWindowCompactionStrategy仅适用于时间序列用例,也是您选择TWCS的唯一原因。

LeveledCompactionStrategy的边缘案例非常有限,我花在帮助用户排除LCS故障上的时间,因为它不适合他们的需求,这几乎不值得获得所谓的好处。

除非您有一些非常具体的要求,否则SizeTieredCompactionStrategy几乎总是正确的选择,这也是它是默认压缩策略的原因。干杯

最新更新