我有一个数据库,里面有数百万条记录。
表有两个属性1]Name 2] Location
有许多记录有不同的名称,但相同的位置,所以有任何压缩技术,可以应用于位置属性?
您可以建议各种无损压缩技术及其支持的数据库名称。
规范化数据库。创建一个LOCATIONS
表,并为第一个表指定一个外键。
少于65,535个不同的位置?在原始表中,每条记录占用两个字节。如果你问我的话,我觉得压缩效果不错。也使索引和比较更快。
数据比代码重要。首先要做好数据准备。默认情况下尽可能规范化。只有在发现一个(特定的、经过测量的、完全归因的)性能问题或一些重大原因后,才取消规范化。
要查找空间索引。si将2d复杂度降低到1d复杂度。用于热图和树状图。它看起来像一棵四叉树