-
在数据仓库项目中,为什么我们需要在从登陆/暂存区域数据库传输数据集市(使用 Kimball 方法)中的数据之前使用 DataVault 建模?即为什么我们不能使用 Kimball 方法将数据直接从着陆/暂存区域数据库传输到最终数据集市?
-
必须这样做吗?
好吧,您不需要使用数据保管库方法。此外,您不需要使用金博尔。此外,您不需要使用 3nf。
这完全取决于您环境中的要求。上
- 数据结构,
- 数据复杂度,
- 上浆
- 附表
- 更改源格式,
- 历史化的必要性,
- 报告、仪表板或其他 ETL 结构的要求...
没有"需要"专门做数据保险箱。
这完全取决于你想做什么以及你的要求是什么。
> 我注意到最近,Data Vault 2.0 方法在 EDW 项目中变得非常普遍。Kimball/Star模式数据模型仍然被大量使用,但它们主要只是允许报告的数据保险库顶部的顶层抽象。
Kent Graziano在这里有一个很好的入门来理解DV建模,这是Dan Linstedt的书的摘录(也是一本很棒的读物)。