用于语义分割的单热标签



在阅读语义分割论文时,有时我可以阅读像掩码图像的单热标签这样的术语。我不清楚这到底是什么意思?当阅读一些实现时,我可以看到它们通常是形状的rows*columns*2

我猜一个通道对应于前景,另一个对应于背景。对吗?此外,我怎么知道哪一个是前景?如果现有的训练集只有形状为rows*columns*1的。我如何将其转换为这种格式,即rows*columns*2 ?我所做的只是使用newimage[:,:,:,0] = original_imagenewimage[:,:,:,1] = 1-original_image。但我不确定这是否正确?

分类标签如1,2,3,4,5等没有任何自然顺序。因此,使用这些数字可能意味着标签5大于标签1,但冰箱和狗只是两个标签,例如没有自然顺序。

我们将标签1 2 3 4 5转换为

[1,0,0,0,0],[0,1,0,0],…,[0,0,0,0,1]

所以现在它们只是指向某个方向的向量,这使得逻辑回归和其他损失函数更容易处理。

也可以用行*列*1对前景背景进行编码

简单地将前景值设置为1,背景值设置为0,然后我们就有了前景背景蒙版。

我需要看到一个何时使用行*列*2的例子,因为这个不是很常见,可能会根据你在哪里看到它而有所不同。

最新更新