使用scikit学习和概率而不是简单标签进行多标签分类

我想对一组3D图像（MRI）进行分类。有 4 个类别（即疾病 A、B、C、D 的等级），其中 4 个等级之间的区别并非微不足道，因此我对训练数据的标签不是每张图像一个类。这是一组 4 个概率，每个类一个，例如

0.7   0.1  0.05  0.15
0.35  0.2  0.45  0.0
...

。基本上意味着

我不明白如何使用这些标签拟合模型，因为scikit-learn分类器期望每个训练数据只有一个标签。仅使用概率最高的类会导致悲惨的结果。

我可以使用scikit-learn多标签分类（以及如何）训练我的模型吗？

请注意：

我可以使用乘法分类框架以某种方式处理这个问题吗？

为了使predict_proba返回每个类 A、B、C、D 的概率，需要为每个图像使用一个标签来训练分类器。

如果是：如何？

使用图像类作为训练集中的标签（Y）。也就是说，您的输入数据集将如下所示：

F1  F2  F3  F4  Y
1   0   1   0   A
0   1   1   1   B
1   0   0   0   C
0   0   0   1   D
(...)

其中F#是每个图像的特征，Y是医生分类的类别。

如果没有：还有其他方法吗？

对于每个图像有多个标签的情况，即多个潜在类或其各自的概率，多标签模型可能是更合适的选择，如多类和多标签算法中所述。

相关内容