F1-数据不平衡的分数



我正在处理一个二进制分类任务。我的评估数据不平衡,由大约。20%来自第一类,80%来自第二类。即使我对每种类别类型都有很好的分类精度,第一类为0.602,第二类为0.792。如果我计算f1分数超过第一类,我得到0.46,因为假阳性计数很大。如果我在第二类上计算,我得到的f1分数是0.84。

我的问题是,在不平衡数据上评估分类任务的最佳实践是什么?我可以得到这些f1成绩的平均值吗?还是应该从中选择一个?在不平衡数据上评估分类任务的最佳评估指标是什么?

顺便说一句,这些是我的TP、TN、FN、FP计数;

TP:115

TN:716

FN:76

FP:188

我不确定这是否是你想要的,但由于你想要从中获得性能指标的数据是不平衡的,你可以尝试应用加权测量,例如加权f1分数。从scikit了解到,f1分数具有"加权"选项,该选项考虑每个标签的实例数。这样你就可以得到F1的平均成绩。

https://scikit-learn.org/stable/modules/generated/sklearn.metrics.f1_score.html

我希望这能有所帮助!

最新更新