从精度计算准确性,召回率,f1分数 - scikit-learn



我犯了一个巨大的错误。我将scikit-learn svm精度的输出打印为:

str(metrics.classification_report(trainExpected, trainPredict, digits=6))

现在我需要从以下输出中计算精度:

              precision    recall  f1-score   support
1             0.000000  0.000000  0.000000      1259
2             0.500397  1.000000  0.667019      1261
avg / total   0.250397  0.500397  0.333774      2520

是否可以根据这些值计算精度?

PS:我不想再花一天时间来获取模型的输出。我刚刚意识到这个错误,希望我不需要从头开始。

您可以从精度、召回率和真/假阳性的数量或在您的案例支持中计算准确性(即使由于分子或分母 0 而导致精度或召回率为 0(。

TruePositive+FalseNegative=Support_True
TrueNegative+FalsePositive=Support_False
Precision=TruePositive/(TruePositive+FalsePositive) if TruePositive+FalsePositive!=0 else 0
Recall=TruePositive/(TruePositive+FalseNegative) if TruePositive+FalseNegative!=0 else 0
Accuracy=(TruePositive+TrueNegative)/(TruePositive+TrueNegative+FalsePositive+FalseNegative)

-或-例如,给定真正/真负计数,则:

TPP=TruePositive/Precision=TruePositive+FalsePositive if Precision!=0 and TruePositive!=0 else TPP=0
TPR=TruePositive/Recall=TruePositive+FalseNegative if Recall!=0 and TruePositive!=0 else TPR=0

在上面,当 TruePositive==0 时,如果没有有关 FalseNegative/FalsePositive 的更多信息,则无法进行计算。 因此,支持更好。

Accuracy=(TruePositive+TrueNegative)/(TPP+TPR-TruePositive+TrueNegative)

但是在您的情况下,给出的是支持,所以我们使用召回:

Recall=TruePositive/Support_True if Support_True!=0 else 0
TruePositive=Recall*Support_True, likewise TrueNegative=Recall_False*Support_False in all cases
Accuracy=(Recall*Support_True+Recall_False*Support_False)/(Support_True + Support_False)

在您的情况下(0*1259+1*1261)/(1259+1261)=0.500397这正是您只预测一个类时所期望的。 在这种情况下,相应的精度分数将成为准确性。

就像另一张海报说的,最好使用图书馆。 但由于这听起来也像是一个潜在的数学问题,所以可以使用它。

无需花更多时间在上面。metrics模块包含您需要的一切,并且您已经计算了预测值。这是一行变化。

print(metrics.accuracy_score(trainExpected, trainPredict))

我建议您花一些时间阅读链接页面,以了解有关评估模型的更多信息。

我确实认为你手头有一个更大的问题 - 你的1类的预测值为零,尽管有平衡的类。您的数据、建模策略或代码中可能存在必须处理的问题。

相关内容

  • 没有找到相关文章

最新更新