从星型ETL到数据仓库



我们正忙于学校的一个项目。我们必须建立一个数据仓库,但我坚持了下来。

我有以下星模式:

dim_location:

Location_key(主键)

城市

dim_condition:

条件密钥(主键)

描述(例如:好、坏、非常坏、非常好等)

dim_time:

时间键

年度

日期

季度

等等。

事实表地面:

Time_Key(外国)

Location_Key(国外)

条件密钥(外国)

位置维度应该是一个包含所有类型位置的表。条件维度应该是一个包含好、坏、不那么坏、非常好等条件的表。时间维度应该是一个包含所有日期、季度等的表格。

我应该知道的是:"我想知道在某个日期,在某个地点,地面出现了某种情况">

示例:1月20日星期一,阿姆斯特丹的情况并不好。

我有一些垃圾堆,我应该用它们来填充这些维度和事实。但我不知道最好的方法是什么,以及如何填写事实表。我已经填写了SSIS中的维度,这很好,但我无法填写事实表。(已尝试:多个查找、合并、合并联接)有人能分步骤告诉我应该如何制作数据仓库并填充它吗(最好的方法)?

抱歉我英语不好。

非常感谢您的帮助。

谢谢!!

最简单的开始方式是完全刷新,这样您的设计可以快速适应。因此,从执行SQL任务开始,截断目标表。然后添加数据流任务以重新加载事实数据表。从源(通常是OLE DB)开始。添加查找(通常为"完全缓存")以获取维度关键帧,每个维度一个。以插入数据的目的地(通常是OLE DB,具有快速加载和表锁定)结束。

随着软件包的成熟,您可以添加诸如增量提取和禁用/重建索引之类的功能。

祝你好运!

最新更新