我想对一组3D图像(MRI)进行分类。有 4 个类别(即疾病 A、B、C、D 的等级),其中 4 个等级之间的区别并非微不足道,因此我对训练数据的标签不是每张图像一个类。这是一组 4 个概率,每个类一个,例如
0.7 0.1 0.05 0.15
0.35 0.2 0.45 0.0
...
。基本上意味着
- 第一张图像属于 A 类,概率为 70%,B 类为 10%,C 类为 5%,D 类为 15%
- 等等,我相信你明白了。
我不明白如何使用这些标签拟合模型,因为scikit-learn分类器期望每个训练数据只有一个标签。仅使用概率最高的类会导致悲惨的结果。
我可以使用scikit-learn多标签分类(以及如何)训练我的模型吗?
请注意:
- 特征提取不是问题。
- 预测不是问题。
我可以使用乘法分类框架以某种方式处理这个问题吗?
为了使predict_proba
返回每个类 A、B、C、D 的概率,需要为每个图像使用一个标签来训练分类器。
如果是:如何?
使用图像类作为训练集中的标签(Y
)。也就是说,您的输入数据集将如下所示:
F1 F2 F3 F4 Y
1 0 1 0 A
0 1 1 1 B
1 0 0 0 C
0 0 0 1 D
(...)
其中F#
是每个图像的特征,Y
是医生分类的类别。
如果没有:还有其他方法吗?
对于每个图像有多个标签的情况,即多个潜在类或其各自的概率,多标签模型可能是更合适的选择,如多类和多标签算法中所述。