关于量化的Mobilenet SSD V2的所需300x300输入的一些问题

我想重新训练量化的Mobilenet SSD V2模型，所以我从COCO下载了未标记的文件夹。这个模型需要300x300的输入大小，但我成功地在不同大小的图片上重新训练了一次，它很有效(很差，但有效(。此外，使用重新训练的模型的代码将相机的输入大小调整为500x500，这样就可以工作了。所以我的问题是，如果它也适用于其他尺寸，为什么要写要求的输入是300x300？在标记之前，是否需要将所有数据集的大小调整为300x300？我知道它对输入进行卷积，所以我认为大小并不重要(如果我错了，请纠正我(。正如我所知，卷积一直持续到我们到达输入的末尾。

谢谢你的帮助！

如果我理解正确，您正在使用TF对象检测API。给定的模型，如mobilenet-v2-sd，包含3个主要块：[预处理(标准化和调整大小]->[检测器(主干+检测头(]->[后处理(bbox解码+nms(]

当他们谈论所需的输入时，这是针对检测器的。。检查点本身包含完整的管道，这意味着预处理单元将为您完成工作，因此无需事先将其调整为300x300。

如果出于某种原因，您打算自己将输入直接注入检测器，则必须执行与训练中相同的预处理。

顺便说一句：在培训的配置文件中(https://github.com/tensorflow/models/blob/master/research/object_detection/samples/configs/ssd_mobilenet_v2_coco.config)您可以看到已定义的大小调整：image_resizer{fixed_shape_sizer{高度：300宽度：300}}-归一化是移动网归一化(将输入的动态范围从[0255]更改为[-1,1]

相关内容

最新更新

热门标签：