为什么数据仓库时间取决于时间



在我的教科书中,它说数据仓库中的数据仅在一段时间内有效,换句话说,它被认为是依赖时间的,但是根据数据的四个特征仓库,非挥发性属性说,一旦数据输入数据仓库,就不可能更改它。

那么,还有其他数据仓库的属性谈论数据仓库与时间有关吗?

您的教科书是否说"时间依赖"或"时间变体"?可能会阐明法案的定义,即数据仓库是面向主题,集成,时间变体和非挥发性的。

"时间变体"表示数据仓库完全包含在一个时期内。另一种说明的方式是,DW在一段时间内是一致的,这意味着数据仓库每天,每小时或在其他周期性的基础上加载,并且在此期间不变。

请记住,这些要求是在1992年编写的,大约25年后,当实时数据仓库成为现实时,它们很难支持,并且数据仓库每秒可能会更改几次。

另外,请注意"非易失性"的定义。有些人将其解释为意味着数据永远不会改变,但这再次是一个过时的概念。累积的快照事实表,显示订单的预测日期可能会在订单生命中多次更新。当然,这取决于事实的目的 - 如果是在预测日期中衡量波动率,我们将保留每一个更改,但是如果是通过其生命周期来衡量订单的流量。

就个人而言,我更喜欢拉尔夫·金博尔(Ralph Kimball(的定义:"数据仓库是专门为查询和分析构建的交易数据的副本。"更加清晰,要点。

最新更新