我正在尝试为Sales表中的每个不同产品创建唯一买家的摘要。我的目标结果如下:
CustSeg | >>>UNIQUE_PROD1_CUST||
---|---|---|
0 | 高 | 7 |
1 | 低 | 8 |
2 | Mid | //tr>
感谢您分享一个可复制的示例,看起来您已经取得了很好的进展。如果我理解正确的话,你希望能够计算出每个细分市场购买特定商品的独特客户数量。
为了遵循您的方法,您可以迭代产品列,计算计数,并将其分配给结果数据帧:
prod_cols = [col for col in Sales_Df.columns if col.startswith('Prod')]
result = None
for prod in prod_cols:
counts = (
Sales_Df
.loc[Sales_Df[prod] > 0]
.groupby('CustSeg')
[prod]
.count()
)
if result is None:
result = counts.to_frame()
else:
result[prod] = counts
CustSeg | Prod1_Qty | Prod2_Qty | tbody>||
---|---|---|---|---|
高 | 7 | >td style="text align:right">66 | 7 | |
低 | 8 | |||
Mid | 4 | 2 | 4 | 4 |