聚类算法性能检查非情节能力数据



我正在使用 sci-kit 学习库的Kmeans固定算法,学习库和我的数据的尺寸是 169 ,这就是为什么我无法可视化聚类的结果。

有什么方法可以测量算法的性能?

其次,我有数据标签,我想使用测试数据集测试学习的模型,但我不确定标签Kmeans algo给了群集与我的标签一致。

有可视化高维数据的方法。您可以采样一些尺寸,使用PCA组件,MDS,TSNE,并行坐标等。

,如果您甚至只是阅读有关聚类的Wikipedia文章,则有一个评估部分,包括受监督和无监督的评估。但是这种评估的结果可能非常误导...

请记住,如果您标记了数据,则监督方法应始终超过没有标签的无监督方法:他们不知道要寻找什么 - 有理由相信每个聚类都与一些标签。特别是,在大多数数据上,将有许多合理的聚类捕获数据的不同方面。

相关内容

最新更新