为什么 F1 度量对评估多类分类器有效?



我一直在为多类分类器寻找一个好的误差指标,很多人说通常使用 F1 度量。 但是,鉴于多类分类器的预测是单热向量,这是否意味着当预测错误时没有真正的阳性? 我的意思是:

图像

当预测正确时,除了单个"1"之外,每个元素都是真阴性的。所以这里的精度只有 1。

图像

当预测不正确时,就没有真正的阳性。所以精度为 0。

我知道 F1 在多标签分类方面是一种强大的度量方法,因为向量中可以有多个 1,但在多类分类上应用 F1 对我来说似乎有点奇怪。准确性不也一样吗? 还是意味着应该使用每班的F1 分数?

我建议看看维基百科,特别是"扩展到多类分类"部分。

关于如何将 F1 应用于多类分类器的良好解释可以在 Coursera 上找到。

相关内容

  • 没有找到相关文章

最新更新