RedShift 的排序键与聚簇索引有何不同?



>RedShift有一个名为sortkey的工具,您可以指定该列。这将确保数据保持此排序顺序。

这与聚集索引有何不同?这做同样的事情。

Amazon Redshift 不支持索引。因此,将其称为指数将具有误导性。

相反,数据按请求的顺序物理存储。这样做的好处是启用区域映射,该区域映射标识给定块中存储的数据范围。例如,如果数据按日期排序,则每个区域地图将标识存储在该区域中的最早和最晚日期。这有助于 Redshift 忽略不包含相关数据的块。

SORTKEY 还可以包含多列,甚至是交错排序 - 一种在保持效率的同时组合两个不同排序顺序的方法。

最新更新