嗨,我在这里寻求帮助。我是Azure数据工厂的新手,我需要将一些Excel文件转换为csv,如何做到这一点?
据我所知,ADF目前不支持Excel文件,只支持这些格式。
因此,您可以尝试一些变通方法来处理ADF:中的excel文件
1.使用Databricks Activity加载excel文件并转换为csv文件,请参考这个案例:如何在Scala Spark中从excel(xls,xlsx(文件构建Dataframe?
2.使用Azure Function Activity将excel文件转换为csv文件,您可以选择开发语言来实现。然后将csv文件输出到特定路径中,并在接下来的步骤中使用它们。
3.尝试自定义活动,它实际上是在Azure批处理节点上运行的任务(例如,执行Powershell脚本(。这种方法更灵活,更易于操作。
自2022.xlsx
和.xls
文件支持作为源文件,但不支持作为汇文件。
这意味着我们可以在Azure Synapse/Azure数据工厂中使用copy
活动来从xlsx
文件(=源(的特定表中提取数据,并将其复制到csv
文件(=接收器(。