我目前正在SAS做一个客户细分项目。
我已经确定了2700名客户,他们在我分析的4年中每年都进行了购买。对于聚类分析,每年的购买量/客户数量越多,数据质量越好。然而,当我对每个客户每年所需的购买数量变得更加挑剔时,在聚类分析中可以考虑的客户就越少。
我应该如何选择每个客户每年需要购买的数量的截止点来进行分析。我在数据质量和有足够的客户进行分析之间进行权衡。
非常感谢!:)
没有正确的方法。这完全取决于你的数据。
聚类这样的数据是"神奇的",结果往往是统计上合理的。更像是随机猜测。
因此,总是尝试多个参数并仔细检查结果。没有公式能告诉你什么是好的聚类。