Cassandra vs Hbase用于存储每个用户的事件计数



我想知道我们是否应该在以下情况下使用Hbase或Cassandra:

  1. 我需要每个客户的事件跟踪。哪个将存储一个每天为一个客户排一行,第二天将创建另一个同一客户的行。但这一行可能会得到更新经常在一天内为客户服务。现在,当表上的频繁更新。

  2. 如果频繁更新,数据将被拆分为多个SS表格。这将导致阅读时的延迟增加。卡桑德拉柜台后面的主要用途是什么?

  3. 此外,在hbase的情况下,存在单个点的问题失败

  1. Cassandra似乎适合您的用例,因为它在编写方面非常高效。它看起来像经典的"时间序列"情况:对于每个客户日(=分区键),在分区中插入每个事件
  2. 有几种策略可以提高更新和读取性能:插入新行而不是更新现有行,使用分级压缩而不是大小分层压缩,使用缓存。。。计数器通常用于计算统计信息,如点击次数、页面视图。。。当故障发生时,它们可能是不正常的,而且效率比不上启动
  3. HBase是一个主从式的,将数据存储在HDFS中(性能较低),并且设置起来更复杂(HDFS、Zookeeper),除非您已经有Hadoop分发版。您可能对此视频感兴趣(跳过开头)

最新更新