计算分类准确性的最佳方法



我知道计算分类精度的一个公式是X = t/n * 100(其中t是正确分类的数量,n是样本的总数。

但是,假设我们总共有 100 个样本,A 类 80 个,B 类 10 个,C 类 10 个。

场景 1:所有 100 个样本都分配到 A 类,通过使用公式,我们得到的准确率等于 80%。

场景 2:属于 B 的 10 个样本被正确分配到 B 类;10 个属于 C 的样本也被正确分配到 C 类;30 个属于 A 的样本被正确分配到 A

类;其余 50 个属于 A 的样本被错误地分配到 C 类。通过使用该公式,我们获得了 50% 的准确率。

我的问题是:

1

:我们可以说场景 1 的准确率高于场景 2 吗?

2:分类问题的准确率有没有办法计算?

非常感谢!

分类准确性定义为"正确预测的百分比"。无论类的数量如何,情况都是如此。因此,方案 1 的分类准确性高于方案 2。

但是,听起来您真正要求的是一个替代评估指标或过程,以"奖励"场景 2 只犯某些类型的错误。我有两个建议:

  1. 创建混淆矩阵:它描述了分类器的性能,以便您可以查看分类器正在犯的错误类型。
  2. 计算每个类的精度、召回率和 F1 分数。平均 F1 分数可能是您要查找的单个数字指标。
scikit-learn文档的分类

指标部分有很多关于分类器评估的好信息,即使您不是scikit-learn用户。

相关内容

最新更新