字段标识,在 Spark 中的 except() 操作期间



Sparkworkexcept()函数,用于比较两个数据帧并从第一个数据帧返回不匹配的记录。

但是,我也想跟踪字段详细信息,这些字段不匹配。 如何在火花中做到这一点?? 请帮忙

如前所述,除了会给你完全的行不匹配。所以我建议使用 leftanti join 而不是 except ,并有一个或几个连接键作为条件。您可以采用的主键或组合键。这将使您与这些键的行不匹配。然后,您需要再编写一个查询,其中您的键与即交集匹配,但其他列中的任何不匹配。为此 w.r.t 键编写一个内部连接,其中 table1.colA != table2.colA 就像这样用于所有字段的情况。

最新更新