集群验证:如何验证和度量预定义的集群



我是python的新手,正在处理一个消费者数据集,我们使用LCA, K-Means, DBSCAN和谱聚类来计算聚类。在所有这些方法中,簇的数量是不同的(例如,K-Means中有5个簇,而LCA中有7个簇),独立变量可能是相同的,也可能不是相同的(例如,K-Means中有12个独立变量,而LCA中有10个)。现在我想用聚类内聚、聚类分离、熵、纯度、Jaccard Coeff、RAND指数等来验证集群。我需要帮助;

  1. 这些措施是否适用于群集验证?
  2. 在python中是否有任何函数/库,我可以一次计算所有这些?
  3. 如果没有可用的函数/库,如何在python中计算这些

希望我说得清楚,提前感谢您的帮助。

Sklearn随时可以获得所有这些参数。是否合适?这些是对聚类结果进行评分的标准和可接受的指标。如果聚类是适合您问题的工具,那么这些指标适合验证您的结果。

最新更新