我正在处理一个二进制分类任务。我的评估数据不平衡,由大约。20%来自第一类,80%来自第二类。即使我对每种类别类型都有很好的分类精度,第一类为0.602,第二类为0.792。如果我计算f1分数超过第一类,我得到0.46,因为假阳性计数很大。如果我在第二类上计算,我得到的f1分数是0.84。
我的问题是,在不平衡数据上评估分类任务的最佳实践是什么?我可以得到这些f1成绩的平均值吗?还是应该从中选择一个?在不平衡数据上评估分类任务的最佳评估指标是什么?
顺便说一句,这些是我的TP、TN、FN、FP计数;
TP:115
TN:716
FN:76
FP:188
我不确定这是否是你想要的,但由于你想要从中获得性能指标的数据是不平衡的,你可以尝试应用加权测量,例如加权f1分数。从scikit了解到,f1分数具有"加权"选项,该选项考虑每个标签的实例数。这样你就可以得到F1的平均成绩。
https://scikit-learn.org/stable/modules/generated/sklearn.metrics.f1_score.html
我希望这能有所帮助!