了解 ADF 数据集



我知道在 Azure 数据工厂中,数据集是某些源数据的视图。是否可以从联接两个源表的查询创建单个数据集?或者,是否必须创建两个数据集(一个使用联接转换的数据流(来创建第三个数据集(作为该转换的接收器(,这是所需的结果?

似乎源表不是 ADF 中的东西,只是数据集(只是表(?我觉得这非常令人困惑,也许我不明白更高的背景。

数据集不是数据的视图,而是指向位置的指针,以及可选的在该位置找到的架构的说明。在您的情况下,指向表的指针,所以是的,您需要为每个 SOURCE 表提供一个带有架构的数据集。可以在数据流中将它们联接在一起,然后需要接收器的另一个数据集。根据接收器类型,可能需要也可能不需要创建架构。

我假设表有一些SQL变体 - 如果是这样,如果两个表在同一个数据库中,那么我建议在SQL中进行JOIN,因为它会更快,更高效。如果接收器也位于同一数据库中,则从存储过程而不是数据流中获得的里程最多。

相关内容

  • 没有找到相关文章

最新更新