多列族还是单列族的HBase扫描性能更好?



我想在HBase中存储一个对象(payload)和一些元数据。

然后我想在表上运行查询,并根据元数据信息提取有效负载部分。

例如,假设我有以下列限定符

  • P: Payload(大于M1 + M2).
  • M1: Meta-Data1
  • M2: Meta-Data2

然后运行如下查询:

  • 获取M1='search-key1'的所有有效载荷&&M2 = ' search-key2 '

是否有意义:

  1. 保持M1和M2在一个列族,P在另一个列族?扫描会更快吗?
  2. 保持所有3列在同一列族?

通常情况下,我会做一个峰值(我可能仍然需要)-我想我先问。

我会尝试遵循HBase Reference中给出的建议,并使用选项#2 (将所有3个col保持在同一列族):

如果可以的话,尝试在模式中使用一个列族。只有在数据的情况下引入第二和第三列族访问通常是列范围的;即查询一个列族或另一个,但通常是,而不是同时.

相关内容

  • 没有找到相关文章

最新更新