pyspark databricks代码对传入文件进行零字节检查



如何对数据块中的传入文件进行审计检查。希望python代码做零字节检查(应该检查文件是否有数据),如果文件有数据,那么它应该继续进程,否则它应该停止进程并发送电子邮件。

Databricks有butils。返回目录中的文件列表,包括文件大小。您可以使用这些信息来检查每个用例。

最新更新