"Metadata driven"意味着什么?我一直在 ETL 上下文中听到这句话,但永远无法弄清楚



Appologies如果我问了一个不恰当的问题,但我多年来一直听到"元数据驱动"这句话,但始终无法理解。

根据我的理解,元数据是关于数据的数据(iformation)!我或多或少地理解这一点!!

但当我听到"元数据驱动"(特别是在ETL世界中)时,我无法理解它的确切含义。

我对一个ETL工具SSIS有很好的经验,所以在它的上下文中的示例将很容易解开。

假设您正在将5行从表A移动到表B,并且您希望确保只有符合特定条件的行受到影响。在这种情况下,您的流程依赖于数据,因此是数据驱动设计的一个示例。

现在,让我们想象一下,您有几个"相似"的源和/或目标表模式,它们在处理它们的方式上相似,但在具体实现上不同(表名、列名、列数据类型,甚至是数据库类型:Oracle、MS SQL、Sybase,甚至是平面文件或XML),所以您想要的是"插入"源和目标、数据库连接,等等。

您需要的是将"逻辑"ETL过程与"物理"实现清楚地分离开来。换句话说,您希望ETL以通用逻辑单元/术语进行描述,在其运行过程中用实际物理单元/术语替换。

然后,您得到的是ETL过程的描述,该过程对于任何情况都足够通用,并根据这些源和目标的元数据为特定的源/目标系统运行适当的定制-一个元数据驱动的设计,它允许您拥有ETL过程的通用"逻辑"表示,该表示在运行时成为"物理实例化"。

最新更新