对于非常无架构的宽行,什么是好的数据存储?



我正在寻找具有以下特征的数据。

  • 我正在存储有关 Person 对象的信息
  • 一个人可以有数千个属性
  • 不是每个人都有所有属性
  • 它应该是基于列的,因为查询通常涉及少数(10 个以下(属性
  • 它应该是无模式的,因为我会定期添加新的属性类型
  • 目前大约 100GB 的数据,将扩展到 500GB-1TB

存储此类数据的好解决方案是什么?

这个问题可能有点偏离主题,因为它更多的是解决方案设计而不是严格的编程,但从你的要求来看,听起来你有一个很好的HBase或Cassandra,或者MongoDB的候选者(尽管我不确定MongoDB在查询数千个属性中的几个属性方面优化得如何(。

最新更新