似乎scikitlearn的f1_score平均微观/宏(http://scikit-learn.org/stable/modules/generated/sklearn.metrics.f1_score.html(是基于多标签数据分类器的,但我想知道是否可以将其用于多标签聚类?
我正在使用的数据是使用 scikit 的 kmeans 在 50.000 个时间序列上进行聚类的。所以我以以下形式的集群结束:c1{ts_1, ts_2 ...}, c2{ts_20, ts_21 ...} 等。
每个时间序列可以有一个太多的标签,我想将其用作 f1 平均微观和宏观分数的黄金标准。然后,集群的时间序列可以用其标签(L(替换:c1{(L_1,L_2(,(L_2(,(L_2(,(L_3,L_4,L_5(...}
f1 平均微观和宏观分数是否可以应用于此类数据集的聚类,或者我应该查看其他分数?
No.因为聚类使用自己的"标签"(通常为 0...k(,并且没有与分类标签一对一匹配。
聚类只是分类也不是分类。术语"无监督分类"非常具有误导性,因为差异可能非常大。这就是为什么聚类中似乎没有人使用这个术语的原因。
请改用任何已建立的集群评估指标。