获取具有唯一索引的行DataFrame Pandas



我通过删除一些包含无效数据的行来格式化excel文件。我正在尝试将删除的数据保存到新的DataFrame中。我创建了原始DataFrame的副本,并想对它们进行比较。我的输出DataFrame中缺少的行应该写入一个新的DF。

path = 'Users/Files/Directory-All.xlsx'
df = pd.read_excel(path)
df2 = pd.read_excel(path)
format_data(df):
pass
df = format_data(df)

那么,如何通过比较df和df2的索引来获得删除的行呢?

哦,我明白了。

indexes = [x for x in df2.index if x not in df.index]
df2.iloc[indexes]

最新更新