主要问题:
我需要使用Azure数据工厂管道来协调Python脚本的运行。
我尝试过的:
- Databricks:这个解决方案的问题是成本高昂,速度有点慢(需要启动集群(,而且需要我在笔记本上写代码
- ADF的批处理活动:成本也很高,速度也很慢。我不必把代码写在笔记本上,但我必须手动把它放在存储帐户中,这在调试或更新时不太好
我的问题:
有没有一种方法可以直接从数据工厂在Azure repo(或Github repo(中运行代码?像批处理活动一样,但不是从存储帐户读取代码,而是从回购本身读取代码?
感谢您的帮助
基于文档中的语句"Azure数据工厂中的管道和活动";,Azure Git Repos和GitHub Repos不是ADF管道支持的源数据存储和汇点数据存储。因此,不可能直接从ADF管道中的git存储库运行代码。
但是,ADF具有源代码管理选项,允许您使用Azure Repos或GitHub配置Git存储库。然后,您可以在Azure DevOps上配置CI/CD管道以与ADF集成。CI/CD管道可以直接运行git存储库中的代码。
有关更多详细信息,您可以查看文档";ADF中的CI/CD";。