在熊猫中按列分组选择非重复值

  • 本文关键字:选择 熊猫 python pandas
  • 更新时间 :
  • 英文 :


我有以下代码df1 = df.groupby(['ID_Customer', 'ID_product']).size()用于计算每个客户的每个产品的行数。数据集中每个客户的每个产品都有一行。结果是以下 df1(部分(

ID cust    ID prod   
026        009               30
027        009               1
028        009               15
030        009               30
032        009               30
...

如何计算每个客户的不同产品数量?或者如何实现按列分组选择非重复值

试试下面的代码:

df.groupby('ID_Customer')['ID_product'].count()

让我知道这是否适合您。

谢谢

你可以简单地使用nunique

df.groupby(['ID_Customer'])['ID_product'].nunique()

最新更新