我使用scikit learn来测量具有f-score的多标签分类,其中每个图像的标签不平衡,每个图像的标记数量较低。
我应该使用什么以及为什么?average = "micro"
还是"samples"
?
无论您的数据是有偏的还是无偏的,average='micro'
或average='macro'
都被认为是更好的,因为它可以为您提供"更好";后果您可以参考这个答案来了解为什么宏被认为是好的。