为什么SVHN标签数据只有一个数字?(当图像中的数字可能有几个数字时)



我目前正在处理SVHN数据。

有一件事我很困惑:

为什么标签数据只有一位数字?

既然门牌号码可以是几个数字(比如123、4000等),标签不应该也是s多数字,或者10xn一个热门矢量吗?(10种分类,n=图像中的位数?)

(我相信这个问题的答案应该很容易……然而,我刚刚被困了好几天。)

原因是:

"digitStruct中的每个元素都有以下字段:name是一个包含相应图像文件名的字符串。bbox是一个结构数组,包含图像中每个数字边界框的位置、大小和标签"-link

所以基本上,每一行代表一个数字,图像上有方框,如果图像包含多个数字,那么就有多行。

最新更新