使用scikit学习和概率而不是简单标签进行多标签分类



我想对一组3D图像(MRI)进行分类。有 4 个类别(即疾病 A、B、C、D 的等级),其中 4 个等级之间的区别并非微不足道,因此我对训练数据的标签不是每张图像一个类。这是一组 4 个概率,每个类一个,例如

0.7   0.1  0.05  0.15
0.35  0.2  0.45  0.0
...

。基本上意味着

  • 第一张图像属于 A 类,概率为 70%,B 类为 10%,C 类为 5%,D 类为 15%
  • 等等,我相信你明白了。

我不明白如何使用这些标签拟合模型,因为scikit-learn分类器期望每个训练数据只有一个标签。仅使用概率最高的类会导致悲惨的结果。

我可以使用scikit-learn多标签分类(以及如何)训练我的模型吗?

请注意:

  • 特征提取不是问题。
  • 预测不是问题。

我可以使用乘法分类框架以某种方式处理这个问题吗?

为了使predict_proba返回每个类 A、B、C、D 的概率,需要为每个图像使用一个标签来训练分类器。

如果是:如何?

使用图像类作为训练集中的标签(Y)。也就是说,您的输入数据集将如下所示:

F1  F2  F3  F4  Y
1   0   1   0   A
0   1   1   1   B
1   0   0   0   C
0   0   0   1   D
(...)

其中F#是每个图像的特征,Y是医生分类的类别。

如果没有:还有其他方法吗?

对于每个图像有多个标签的情况,即多个潜在类或其各自的概率,多标签模型可能是更合适的选择,如多类和多标签算法中所述。

相关内容

  • 没有找到相关文章