什么评估分类器?精度和召回率?



我有一些标记的数据,将数据集分类为正数或负数。现在我有一个自动执行相同操作的算法,我想比较结果。

据说我使用精确性和回忆率,但我不确定这些是否合适,因为真正的否定甚至不会出现在公式中。我宁愿对积极和消极使用一般的"预测率"。

如何评估算法的好方法?谢谢!!

没有通用的"最佳"评估方法,一切都取决于您的目标,因为每种方法都会捕获不同的现象:

  • 准确性是简单的衡量标准,非常适合多标签分类和相当平衡的数据
  • F1 分数捕获精度/召回率权衡
  • MCC 是一个很好的度量,非常适合在类大小中比例较大的数据集

最新更新