非平方图像作为yolov3的输入



我正在尝试使用yolov3检测道路对象(很小)。为此,我的数据集由大小3840x400 PX的图像组成。我目前正在使用的网络实现(超级词1)作为输入平方图像。例如,如果我通过它3840x400 PX图像,并且将IMG_Size设置为1000 PX,则将图像大小尺寸为1000x400 PX,然后将其正式调整为1000x1000 PX(将其剩余的600个带有黑色值的信箱以使其剩余的像素以使其剩余的像素,以使其剩下的黑色值以使其将其置于黑色值back不要改变高度方面)。CNN的大多数实现似乎都可以将平方图像作为网络体系结构的输入。我的问题是:如果我手动将网络体系结构更改为非方格尺寸(例如1000x400 PX),Yolo仍然可以工作。为什么艺术中的大多数CNN都使用平方图像?

如果您的所有数据集由矩形组成,而不是正方形。例如3840x400

它比使用平方输入来构建架构作为使用矩形的输入更好的方法。

它在大多数CNN中使用平方图像的原因是"正方形"

有时,在人类姿势估计区域,它们不使用平方图像作为输入。他们使用矩形图像,例如192x256,因为几乎人类站在图像中。

相关内容

  • 没有找到相关文章

最新更新