使用CTAS命令后,Netezza表尺寸增加了



我的netezza中有一张大表格,表尺寸约为600 GB。当我尝试从现有表中创建一个新表时,表尺寸增加了。新的表尺寸为617 GB。

SQL我用来创建新表:创建表new_table_name作为Select *从old_table_name distribution(column_name)上的select *;在new_table_name上生成统计信息;但是,新表和旧表的行计数相同。

增加表尺寸的原因是什么?

预先感谢。

表的'大小'有两个相关的测量:分配和使用的大小(均在字节中)_v_table_storage_stat将帮助您查看给定表的两个尺寸

对于小表来说,分配的尺寸可能比用过的大小大很多倍,并且假设行的均匀分布,每个数据切片将至少分配3MB。我在带有480个数据切片的Double Rack Mako系统上进行大部分工作。因此,任何小于14,4GB的表格或多或少与优化"大小"

的桌子无关紧要

尽管如此,我还是会尝试解释您看到的内容:你必须意识到1)Netezza中的所有数据都被压缩。2)正在为每个单独的数据板上的"块"进行压缩。3)压缩比(压缩后的数据大小除以之前的尺寸)会变得更好(较小),如果每个块中的数据与可想象的最"混合"情况相比具有许多相似之处。4)"分发"one_answers"组织"都会影响这一点。在将数据添加到表格

时,使用的选择语句中的"订单"或"什至'组" 也可以。

在我的系统中,我有一个非常宽的桌子,每天有几个"副本"的客户帐户。每个副本的99%与上一份相同,唯一的副本等诸如"平衡"更改。

通过在AccountID上分发并在AccountId上组织时间戳 - 我看到尺寸较小10-15%。一些数据切片具有更好的效果,因为它们包含许多"系统"帐户ID,这些帐户ID在数据中具有不同的模式。

简而言之:a)这很自然b)不必太担心它:c)网络系统上的"大"表与4核数据库的内存和slooow磁盘不相同:)

相关内容

  • 没有找到相关文章

最新更新