多标签分类中的F1分数,其中一个图像中的标签数量是稀疏的,并且类之间的标签数量有偏差



我使用scikit learn来测量具有f-score的多标签分类,其中每个图像的标签不平衡,每个图像的标记数量较低。

我应该使用什么以及为什么?average = "micro"还是"samples"

无论您的数据是有偏的还是无偏的,average='micro'average='macro'都被认为是更好的,因为它可以为您提供"更好";后果您可以参考这个答案来了解为什么宏被认为是好的。

最新更新