在Redshift上使用哈希键而不是整数键



我正在AWS Redshift上构建一个包含维度和事实的星形模式模型。维度表包含整数值作为键,通常使用标识列。这是在加载事实数据表并根据每条记录的需要用维度键填充事实数据表时在查找中使用的。有人告诉我,我们可以使用哈希键而不是整数键,这将简化加载过程,因为我们不必进行查找,只需对正在使用的自然/业务密钥的值进行哈希。有人尝试过这种方法吗?在数据模型中使用哈希键作为维度键的利弊是什么。这些模型将进一步用于Power BI中的报告,在那里使用哈希键会对性能产生影响吗。

这些模型将进一步用于Power BI中的报告,在那里使用哈希键会对性能产生影响吗。

假设哈希的输出是一个整数,那么这两种方法之间的性能差异非常小。使用0x00000D3F0之类的增量整数,而不是0xE4AE353D之类的哈希生成整数,您可能会对事实表进行更好的压缩,但我不认为这会有什么大不了的。

最新更新