如何对客户的偏好进行聚类



简单地说,我有今年的销售数据集。我需要对用户偏好进行聚类。我为每个用户提供了这些销售矢量。例如我有一个向量,它由1或0组成(买不买这个东西)。

[1       ,0       ,0        ,1       ,0       ]
[product1,product2, product3,product4,product5]

这意味着John购买了product1和product4。可能有人看到了关于这方面的好文章。我需要集群并为其他客户提供不同的东西,例如,如果一些客户有最近的邻居(距离足够小),那么我可以为他提供这个邻居的东西。

提前,很抱歉我的英语不好,谢谢

我对想法或文章感兴趣!

这些客户的实矩阵大小是10^8*10^6

使用市场篮子分析,而不是聚类分析。

特别是,它并不假设每个客户都是典型的(集群的一部分),也不假设一个客户只能是其中一个的一部分。

类规则

butter, bread -> marmelade

非常适合提供产品。

最新更新