我有以下代码df1 = df.groupby(['ID_Customer', 'ID_product']).size()
用于计算每个客户的每个产品的行数。数据集中每个客户的每个产品都有一行。结果是以下 df1(部分(
ID cust ID prod
026 009 30
027 009 1
028 009 15
030 009 30
032 009 30
...
如何计算每个客户的不同产品数量?或者如何实现按列分组选择非重复值
试试下面的代码:
df.groupby('ID_Customer')['ID_product'].count()
让我知道这是否适合您。
谢谢
你可以简单地使用nunique
:
df.groupby(['ID_Customer'])['ID_product'].nunique()