在对数据仓库使用 Kimball 方法之前使用数据保管库建模


  1. 在数据仓库项目中,为什么我们需要在从登陆/暂存区域数据库传输数据集市(使用 Kimball 方法)中的数据之前使用 DataVault 建模?即为什么我们不能使用 Kimball 方法将数据直接从着陆/暂存区域数据库传输到最终数据集市?

  2. 必须这样做吗?

好吧,您不需要使用数据保管库方法。此外,您不需要使用金博尔。此外,您不需要使用 3nf。

这完全取决于您环境中的要求。上

  • 数据结构,
  • 数据复杂度,
  • 上浆
  • 附表
  • 更改源格式,
  • 历史化的必要性,
  • 报告、仪表板或其他 ETL 结构的要求...

没有"需要"专门做数据保险箱。

这完全取决于你想做什么以及你的要求是什么。

> 我注意到最近,Data Vault 2.0 方法在 EDW 项目中变得非常普遍。Kimball/Star模式数据模型仍然被大量使用,但它们主要只是允许报告的数据保险库顶部的顶层抽象。

Kent Graziano在这里有一个很好的入门来理解DV建模,这是Dan Linstedt的书的摘录(也是一本很棒的读物)。

最新更新