如何将所有重复的行移动到单独的数据帧中



我的代码正在使用drop_duplicates删除所有重复项,keep=false。

我遇到的问题是,在删除重复项之前,我想将所有删除的重复项移动到一个单独的数据帧中。我已经想出了下面的代码行,但我认为它只剩下一个重复项,而不是删除所有重复项。

duplicates_df = combined_df.loc[combined_df.duplicated(subset='Unique_ID_Count'), :]

combined_df.drop_duplicates(subset='Unique_ID_Count', inplace=True, keep=False)

你对我如何将第二行代码中删除的所有重复项移动到duplites_df数据帧有什么想法吗?

任何帮助都将不胜感激,谢谢!

试试这个:

duplicates_df = combined_df.loc[combined_df.duplicated(subset='Unique_ID_Count', keep=False)]
combined_df   = combined_df.loc[~combined_df.duplicated(subset='Unique_ID_Count', keep=False)]

最新更新