只有当每个分布的行数超过100万时,我才应该在专用sql池表上创建分区吗



我正试图在一个专用的SQL池中创建一个新表,该池每月将有大约43800条记录。我的问题是-

  1. 我应该创建按月分区吗
  2. 我应该在什么时候创建分区,根据Microsoft文档,我的理解是"当每个分布至少有100万行时,分区是必要的"。但在我的情况下,表格将是新的,数据每月增长约43800

因此,我认为现在不需要分区,但将来可以根据数据量创建分区。我的理解正确吗?

"当每个分布至少有100万行时"意味着表至少有6000万行,因为有60个分布。请不要把桌子分区太多。每个分区被划分为60个称为分布的部分。因此,在您的情况下,每个分区内的每个分布都将有730行。当您过度分区时,行组中永远不会有足够的行来实现良好的列存储压缩。因此,每个分发建议有100万行,这意味着对少于6000万行的表进行分区会适得其反。然而,您不需要仅仅因为超过6000万行就对表进行分区。

在接近5亿行之前,我个人不会考虑分区。假设我有10年的数据和5亿行。按月分区每个分区每个分布产生69444行,这太多的分区了。但是,按年份对该表进行分区会在每个分区的每个分布中产生833333行,这是可以接受的,但处于过度分区的边缘。但是,如果您可以使用分区交换来提高负载性能,那么您可以考虑为不到5亿行的表进行分区。

相关内容

  • 没有找到相关文章

最新更新