我有一个具有性别属性的人卫星。从源系统中,此属性的值可能是:F,M,女性或男性。以下两种方法中的哪一种是数据保险库建模的正确方法?
-
将数据存储在性别中,因为该数据来自来源,在业务保险库中或数据集市中标准化为女性和男性的价值
-
创建一个交叉引用表以将F映射到女性,并将M映射到男性,同时将卫星加载,使用互相参考表将F转换为女性,并将M转换为男性。
我正在使用支持列压缩的亚马逊红移。
我通过电子邮件发送了数据保险库建模方法的创建者Daniel Linstedt,以向他提出同样的问题。他的回答:
"我通常将其存储在进来时,然后将其转换为业务dv。这样,如果业务改变了它的想法,我们可以在不影响历史的情况下重新编写翻译规则。但是那就是我看到的源系统可以在可接受的界限之外传递值。不要试图将其转换为原始DV,这会破坏可审核性。"
数据保险库概念在您拥有非常复杂的业务逻辑时会随着时间而变化,但f/emay和m/aper映射是一种非常简单且稳定的逻辑时,很有用。在这里有交叉引用将过于复杂的事情。我只会将值标准化为f/m,并在此处使用Char(1)列。