小贝子编程

聚类算法性能检查非情节能力数据

本文关键字：能力数据算法性能聚类 python machine-learning scikit-learn cluster-analysis hierarchical-clustering
更新时间 : 2023-09-12
英文 : Clustering algorithm performance check on un plot able data

我正在使用 sci-kit 学习库的Kmeans固定算法，学习库和我的数据的尺寸是 169 ，这就是为什么我无法可视化聚类的结果。

有什么方法可以测量算法的性能？

其次，我有数据标签，我想使用测试数据集测试学习的模型，但我不确定标签Kmeans algo给了群集与我的标签一致。

有可视化高维数据的方法。您可以采样一些尺寸，使用PCA组件，MDS，TSNE，并行坐标等。

，如果您甚至只是阅读有关聚类的Wikipedia文章，则有一个评估部分，包括受监督和无监督的评估。但是这种评估的结果可能非常误导...

请记住，如果您标记了数据，则监督方法应始终超过没有标签的无监督方法：他们不知道要寻找什么 - 有理由相信每个聚类都与一些标签。特别是，在大多数数据上，将有许多合理的聚类捕获数据的不同方面。

相关内容