我有一个场景,希望在两个数据帧之间找到不匹配的行。两个数据帧都将有大约30列和一个唯一标识每个记录/行的id
列。所以,我想检查df1
中的一行是否与df2
中的行不同。df1
是更新后的数据帧,df2
是以前的版本。
我尝试了一种方法pd.concat([df1, df2]).drop_duplicates(keep=False)
,但它只是将两个数据帧结合在一起。有办法做到这一点吗?我真的很感激你的帮助。
两个dfs
的示例数据都是这样的。
id
user_id
type
status
总共有39列,其中可能包含NULL
值。
谢谢。
p.S.df2
将始终是df1
的子集。
如果您的df1和df2具有相同的形状,您可以很容易地与此代码进行比较。
df3 = pd.DataFrame(np.where(df1==df2,True,False), columns=df1.columns)
您将看到布尔输出";"错误";用于与单元格值不匹配。