小贝子编程

Python Panda Dataframe：参数'keep'在 drop_duplicates()/duplicated 中不起作用

本文关键字：duplicates 不起作用 duplicated drop Dataframe Panda 参数 keep Python python pandas dataframe duplicates
更新时间 : 2023-09-01
英文 : python panda dataframe: argument 'keep' not working in drop_duplicates()/duplicated

假设我们有一个数据帧df

df=pd.DataFrame()
df['c1']=[1,2,3,3,4]
df['c2']=["a1","a2","a2","a2","a1"]
df['c3']=[1,2,3,3,5]

如果我使用df.drop_duplicates(keep=False)或df.duplicated(keep=False)，我会得到以下错误：

File "C:UsersKanikaAnacondalibsite-packagespandasutildecorators.py", line 88, in wrapper
return func(*args, **kwargs)
TypeError: duplicated() got an unexpected keyword argument 'keep'

您应该更新您的panda版本，因为它是从0.17.0版本添加的，是从v.0.17.0:中的新内容添加的

drop_duplicates和duplicated现在接受keep关键字作为目标第一个、最后一个和所有重复项

两部作品均为熊猫0.18.1:

In [116]: df
Out[116]:
   c1  c2  c3
0   1  a1   1
1   2  a2   2
2   3  a2   3
3   3  a2   3
4   4  a1   5
In [117]: df.drop_duplicates()
Out[117]:
   c1  c2  c3
0   1  a1   1
1   2  a2   2
2   3  a2   3
4   4  a1   5
In [118]: df.drop_duplicates(keep=False)
Out[118]:
   c1  c2  c3
0   1  a1   1
1   2  a2   2
4   4  a1   5

Python Panda Dataframe：参数'keep'在 drop_duplicates()/duplicated 中不起作用

相关内容

最新更新

热门标签：