小贝子编程

RedShift 的排序键与聚簇索引有何不同？

>RedShift有一个名为sortkey的工具，您可以指定该列。这将确保数据保持此排序顺序。

这与聚集索引有何不同？这做同样的事情。

Amazon Redshift 不支持索引。因此，将其称为指数将具有误导性。

相反，数据按请求的顺序物理存储。这样做的好处是启用区域映射，该区域映射标识给定块中存储的数据范围。例如，如果数据按日期排序，则每个区域地图将标识存储在该区域中的最早和最晚日期。这有助于 Redshift 忽略不包含相关数据的块。

SORTKEY 还可以包含多列，甚至是交错排序 - 一种在保持效率的同时组合两个不同排序顺序的方法。

最新更新