我想在HBase中存储一个对象(payload)和一些元数据。
然后我想在表上运行查询,并根据元数据信息提取有效负载部分。
例如,假设我有以下列限定符
- P: Payload(大于M1 + M2).
- M1: Meta-Data1
- M2: Meta-Data2
然后运行如下查询:
- 获取M1='search-key1'的所有有效载荷&&M2 = ' search-key2 '
是否有意义:
- 保持M1和M2在一个列族,P在另一个列族?扫描会更快吗?
- 保持所有3列在同一列族?
通常情况下,我会做一个峰值(我可能仍然需要)-我想我先问。
我会尝试遵循HBase Reference中给出的建议,并使用选项#2 (将所有3个col保持在同一列族):
如果可以的话,尝试在模式中使用一个列族。只有在数据的情况下引入第二和第三列族访问通常是列范围的;即查询一个列族或另一个,但通常是,而不是同时.