在两个数据帧之间查找不匹配的行



我有一个场景,希望在两个数据帧之间找到不匹配的行。两个数据帧都将有大约30列和一个唯一标识每个记录/行的id列。所以,我想检查df1中的一行是否与df2中的行不同。df1是更新后的数据帧,df2是以前的版本。

我尝试了一种方法pd.concat([df1, df2]).drop_duplicates(keep=False),但它只是将两个数据帧结合在一起。有办法做到这一点吗?我真的很感激你的帮助。

两个dfs的示例数据都是这样的。

iduser_idtypestatus

总共有39列,其中可能包含NULL值。

谢谢。

p.S.df2将始终是df1的子集。

如果您的df1和df2具有相同的形状,您可以很容易地与此代码进行比较。

df3 = pd.DataFrame(np.where(df1==df2,True,False), columns=df1.columns)

您将看到布尔输出";"错误";用于与单元格值不匹配。

最新更新