Hbase vs Cassandra:哪个更适合时间序列数据存储



我使用我的 API 日志来提取以下信息:

  • 在这段时间里,我的API有多少用户?
  • 或者在这段时间里,什么类型的服务叫最多?

我提取的几乎所有信息都取决于时间戳。实际上我使用MongoDB,并将时间戳添加为索引(对于80GB,索引大小为12GB)。

建议我迁移到Cassandra或Hbase。我想知道哪个更适合我的用例:

  • 分析时间序列数据。
  • 需要良好的写入和读取性能。
  • 使用hadoop进行数据分析的可能性。

感谢您分享您的观点或经验。

Cassandra的优点:Cassandra通常表现出更好的性能(尽管两者都非常出色)。从操作的角度来看,Cassandra的设置和管理要容易得多(尽管有一些工具可以提供帮助)。

HBase的优点:原生于 Hadoop生态系统

无论如何,HBase都需要你安装Hadoop,你会得到一个不错的二合一。要使用Cassandra,您可能需要使用DataStax Enterprise,一个商业的非开源产品,或者研究使用Spark进行分析工作,该工作具有与Cassandra的开源连接器。

巧克力或香草冰淇淋 - 哪个更好?

我建议你会是最好的决策者。为每个选项设置开发环境,这将告诉您更多关于操作和调优问题的信息,我认为其他人可能能够为您提供。 :)

最新更新