并行作业是在输出到数据集时添加额外的列



编写数据集之前的最后一个作业是转换。它比这复杂得多,但最基本的是:

  • input=A整数、B整数和C整数
  • output=A整数,如果B>10则C为0->C整数

因此,为了澄清,列A刚刚通过,列B和C用于执行称为";C";在最终输出链路中。

当我检查写入数据集的列时,我会看到A和C。我可以保存表定义,这也只是A和C列。然而,当我实际运行作业时,B列也会出现在数据集中,所以我最终会出现(按任何顺序(A、B和C列

我试着删除我的输出数据集,然后重新创建它,给它一个新的名称,但它总是以"结尾;工作柱";B出于某种原因,我不完全理解。我不明白它是如何选择不在最终输出链接中的列并违背我的意愿添加它的。

我不想在我的数据集中放B列,存储它很浪费,而且对开发人员来说很困惑,因为它本来就不应该在那里。如何阻止DataStage编写它?

似乎已经激活了RCP运行时列传播-它将转换所有可用的列,而不依赖于指定的列。

转到阶段(Transformer(-属性-输出选项卡,有一个复选框Runtime Column Propagation-去掉复选标记。在其他阶段,它也可以位于列选项卡上。在作业的作业属性中,还有一个设置将为新链接启用RCP-删除此标记也可以为将来的作业扩展避免此问题。

有关RCP的更多详细信息,请查看此。

最新更新