有没有更好的方法来查找重复的行_包括_第一个/最后一个



考虑一个熊猫数据框:

import pandas as pd
df = pd.DataFrame({
    'a': pd.Series([1,1,1,2,3]),
    'b': pd.Series(list('asdfg'))
})

我想返回列a的所有具有重复值的行,包括第一行或最后一行。我可以这样做

df[df['a'].duplicated() | df['a'].duplicated(take_last=True)]

有没有更好的方法?

您可以count出现a并返回重复行的values>1

In [25]: df[(df.groupby('a').transform('count')>1).values]
Out[25]:
   a  b
0  1  a
1  1  s
2  1  d

相关内容

最新更新