HBase 列家族产地



在五台服务器上有 HBase,其中一台表包含一列 family,我应该为每个键对其执行一些map任务并保存结果。 主要问题是:

保持数据局部性哪一个更好:在现有表上创建新的列族还是创建新表

和下一个问题:

HBase 文档建议保持少于三个列系列,正如我所说,我有十多个map任务,并且愿意将每个结果保留在新的列系列中。我该怎么办? 因为每个map任务都与另一个不同。位置保存和搜索成本很重要。

哪个更好:在现有表上创建新的列族 或创建新表

我建议更多地关注表设计的架构和简单性,而不是试图破解HBase内部以获得最佳性能。如果来自这 2 列系列的信息是相关的,并且您需要在 map-reduce 扫描中访问这两个 CF - 将它们保留在同一表中。如果信息是 100% 独立的,并且您永远不需要同时扫描它们 - 将它们保存在不同的表中。同样,这是一个模式设计问题,不要尝试执行过早的优化。

第二个问题 - 我不明白你在说什么,对不起。

相关内容

  • 没有找到相关文章

最新更新