我正在训练不同的分类器,如决策树或SVC,它们总是预测相同的标签。预测它的标签是数据集中最常见的标签。报告是这样的:
precision recall f1-score support
1 0.46 1.00 0.63 263
2 0.00 0.00 0.00 163
3 0.00 0.00 0.00 144
avg/total 0.46 1.00 0.63 570
有没有办法避免分类器预测最频繁的类?
SVC构造函数有一个参数weight,可以设置为'auto'。这使得权重与标签频率成正比。