宏观 VS 微观 VS 加权 VS 样本 F1 分数

在sklearn.metrics.f1_score中，f1分数有一个叫做"average"的参数。宏观、微观、加权和样本是什么意思？请详细说明，因为在文档中没有正确解释。或者简单地回答以下内容：

问题是关于sklearn.metrics.f1_score中average参数的含义。

从代码中可以看出：

我找到了一篇非常有用的文章，更彻底地解释了差异，并举例说明：https://towardsdatascience.com/multi-class-metrics-made-simple-part-ii-the-f1-score-ebe8b2c2ca1

不幸的是，它没有解决"样本"参数，我还没有尝试多标签分类，所以我无法回答问题 1。至于其他人：

这些信息从何而来？如果我正确理解了差异，微观不是不平衡数据集的最佳指标，而是最糟糕的指标之一，因为它不包括比例。如文章所述，micro-f1等于准确性，这是不平衡数据的一个有缺陷的指标。例如：分类器应该在数千张随机图片中识别猫图片，只有 1% 的数据集由猫图片组成(不平衡数据集)。即使它没有识别出一张猫图片，它的准确率/micro-f1 分数为 99%，因为 99% 的数据被正确识别为不是猫图片。
简而言之：宏观只是单个分数的算术平均值，而加权包括单个样本大小。我推荐这篇文章了解细节，如果需要，我可以提供更多示例。

我知道这个问题已经很老了，但我希望这对某人有所帮助。如果我错了，请纠正我。我做过一些研究，但不是专家。

相关内容