验证databricks中不同源数据帧中的两个数据列,如果数据按行匹配(记录计数),则执行命令或else错误



数据帧-1:

created year, rec_counts
2016               50
2015               40

数据帧-2:

created year, rec_counts
2016               1000
2015               47

有两种方法可以尝试。

  1. 让我们假设两个数据帧的名称是df1df2

    现在,如果您只想计算行数并检查两者是否具有相同的行数,请使用df1.count()df2.count()并检查两者的输出是否相同(每组中的总行数(。

  2. 其次,您可以编写语句df2.except(df1),这将返回其他数据帧中没有的完整行。如果返回NULL,则表示两个数据帧相同。

最新更新