数据仓库:业务、代理、保留键之间的区别



关于Data Vault的wikipedia文章中提到了代理键和业务键。在这里输入链接描述。这里提到了保留键。

  1. 根据维基百科的文章,为集线器/卫星或链接指定代理键不是强制性的。但是,在链接中,必须为它所连接的集线器指定代理键。如果在集线器中没有强制指定代理键,那么如何在链接表中输入它们呢?

  2. 代理密钥vs业务密钥。需要代理键来连接这些结构。业务键用于唯一地标识项目。但是我们也可以通过代理键来做,不是吗?业务键和代理键之间的主要区别是什么?为什么不能将代理键用作业务键,反之亦然?

  3. 在后来的文章中他们写道:

Hub表-包含业务键和保留键。保留的键是一个一对一映射到业务键的键。相比之下,代理键包括时间,并且可以有多个代理键对应一个业务键。这解释了钥匙的名字,它在插入新版本的行while时保留代理键在增加。为什么我们需要保留密钥?可能有很多来源,所以我们不能使用业务密钥,因为它可能有不同的类型或不同的数量属性。

由于资源很多,同一项可能有不同的业务键。但是这个特定的项将由一个保留的键唯一标识。我理解得对吗?因此,这意味着代理键映射到不同的业务键,而不是一对一的。

假设我们有一个中心&员工"两个不同的业务密钥来自两个不同的部门。有一个员工A,会计部门的员工A有一个业务钥匙AT654,项目部的员工A有一个业务钥匙PR454。hub将为这个雇主提供两个条目:

RetainedKey   BK      TimeStamp    Source
AAA111        AT654   24.03.2012   Accounting
AAA111        PR454   25.03.2012   Project

但是如何合并代理键呢?也就是说,在哪种情况下它会增加(如"这解释了键的名称,在插入新版本的行时保留它,而代理键正在增加")?

有人能给我一个例子(情况)的使用保留键,业务键和代理键?

Data Vault 2.0中有三个主要术语:

  • 业务键:业务如何识别对象的键。
  • 代理键:如果没有可用的直接业务键,业务如何标识对象的键。这是几个字段的组合键,使一行唯一。
  • 哈希键:在hub,卫星和链接中用于连接表的键;它们是由业务/代理键生成的。
  • 保留密钥必须连接到数据库1.0。我从来没听说过。

如果你需要描述这样一个事实:你可能有一个业务键,它在几个系统中不同,但意味着相同,那么你会使用same - as - links表进行存储和查找。

所以要连接你的两个系统,你需要创建一个相同的链接结构,它看起来像这样:

Hash Key        Accounting_Key     Project_Key     Timestamp
xyzabc...       AT654              PR454           24.05.2012

相关内容

  • 没有找到相关文章