小贝子编程

如何将所有重复的行移动到单独的数据帧中

本文关键字：移动单独数据帧 python pandas dataframe duplicates data-cleaning
更新时间 : 2023-09-21
英文 : How to move ALL duplicated rows into separate dataframe

我的代码正在使用drop_duplicates删除所有重复项，keep=false。

我遇到的问题是，在删除重复项之前，我想将所有删除的重复项移动到一个单独的数据帧中。我已经想出了下面的代码行，但我认为它只剩下一个重复项，而不是删除所有重复项。

duplicates_df = combined_df.loc[combined_df.duplicated(subset='Unique_ID_Count'), :]

combined_df.drop_duplicates(subset='Unique_ID_Count', inplace=True, keep=False)

你对我如何将第二行代码中删除的所有重复项移动到duplites_df数据帧有什么想法吗？

任何帮助都将不胜感激，谢谢！

试试这个：

duplicates_df = combined_df.loc[combined_df.duplicated(subset='Unique_ID_Count', keep=False)]
combined_df   = combined_df.loc[~combined_df.duplicated(subset='Unique_ID_Count', keep=False)]

如何将所有重复的行移动到单独的数据帧中

相关内容

最新更新

热门标签：