Pentaho/PDI/Kettle:如何用Excel电子表格中的值填充"Insert / Update"?



我有一个Excel电子表格,其中:

  1. 列 A 填充了目标字段的名称(表字段(
  2. 列 B 提供源字段的名称(流字段(
  3. C 列告诉您是否更新字段,即值为"Y"或"N">
  4. 列 D 和列 E 分别提供目标和源字段的主键。
  5. 行数:超过50万

现在,我想将这些值自动发送到"插入/更新"步骤,即不想复制和粘贴; PDI 应该拉取所有内容。
看了"ETL 元数据注入",认为我可以轻松地将 A 列拉到 C 列。但我根本不知道如何传递主键;换个说法,我不知道如何告诉步骤使用某些值作为主键。
如果它使事情变得更容易,也可以使用 CSV 文件输入或文本文件输入。

任何帮助,不胜感激。提前感谢!

我不确定您是否可以实现这一点,因为元数据注入保留了通用文件结构,并且您无法定义该列是否是主列。 请勿在此阶段使用主键验证,因为调试和错误处理过程将很复杂。 推送临时表中的信息,然后编写逻辑以填充同一主表。这将节省您的大量精力。

最新更新