简单地说,我有今年的销售数据集。我需要对用户偏好进行聚类。我为每个用户提供了这些销售矢量。例如我有一个向量,它由1或0组成(买不买这个东西)。
[1 ,0 ,0 ,1 ,0 ]
[product1,product2, product3,product4,product5]
这意味着John购买了product1和product4。可能有人看到了关于这方面的好文章。我需要集群并为其他客户提供不同的东西,例如,如果一些客户有最近的邻居(距离足够小),那么我可以为他提供这个邻居的东西。
提前,很抱歉我的英语不好,谢谢
我对想法或文章感兴趣!
这些客户的实矩阵大小是10^8*10^6
使用市场篮子分析,而不是聚类分析。
特别是,它并不假设每个客户都是典型的(集群的一部分),也不假设一个客户只能是其中一个的一部分。
类规则
butter, bread -> marmelade
非常适合提供产品。