F1-数据不平衡的分数

我正在处理一个二进制分类任务。我的评估数据不平衡，由大约。20%来自第一类，80%来自第二类。即使我对每种类别类型都有很好的分类精度，第一类为0.602，第二类为0.792。如果我计算f1分数超过第一类，我得到0.46，因为假阳性计数很大。如果我在第二类上计算，我得到的f1分数是0.84。

我的问题是，在不平衡数据上评估分类任务的最佳实践是什么？我可以得到这些f1成绩的平均值吗？还是应该从中选择一个？在不平衡数据上评估分类任务的最佳评估指标是什么？

顺便说一句，这些是我的TP、TN、FN、FP计数；

TP:115

TN:716

FN：76

FP:188

我不确定这是否是你想要的，但由于你想要从中获得性能指标的数据是不平衡的，你可以尝试应用加权测量，例如加权f1分数。从scikit了解到，f1分数具有"加权"选项，该选项考虑每个标签的实例数。这样你就可以得到F1的平均成绩。

https://scikit-learn.org/stable/modules/generated/sklearn.metrics.f1_score.html

我希望这能有所帮助！

相关内容