关于量化的Mobilenet SSD V2的所需300x300输入的一些问题



我想重新训练量化的Mobilenet SSD V2模型,所以我从COCO下载了未标记的文件夹。这个模型需要300x300的输入大小,但我成功地在不同大小的图片上重新训练了一次,它很有效(很差,但有效(。此外,使用重新训练的模型的代码将相机的输入大小调整为500x500,这样就可以工作了。所以我的问题是,如果它也适用于其他尺寸,为什么要写要求的输入是300x300?在标记之前,是否需要将所有数据集的大小调整为300x300?我知道它对输入进行卷积,所以我认为大小并不重要(如果我错了,请纠正我(。正如我所知,卷积一直持续到我们到达输入的末尾。

谢谢你的帮助!

如果我理解正确,您正在使用TF对象检测API。给定的模型,如mobilenet-v2-sd,包含3个主要块:[预处理(标准化和调整大小]->[检测器(主干+检测头(]->[后处理(bbox解码+nms(]

当他们谈论所需的输入时,这是针对检测器的。。检查点本身包含完整的管道,这意味着预处理单元将为您完成工作,因此无需事先将其调整为300x300。

如果出于某种原因,您打算自己将输入直接注入检测器,则必须执行与训练中相同的预处理。

顺便说一句:在培训的配置文件中(https://github.com/tensorflow/models/blob/master/research/object_detection/samples/configs/ssd_mobilenet_v2_coco.config)您可以看到已定义的大小调整:image_resizer{fixed_shape_sizer{高度:300宽度:300}}-归一化是移动网归一化(将输入的动态范围从[0255]更改为[-1,1]

最新更新