训练YOLOv3模型架构CNN的输入图像的大小应该是多少



我已经从头开始实现了YOLOv3,我计划使用MS-COCO权重对一些不同的数据进行微调。我选择的数据集有720*1280大小的图像。

当我浏览YOLOv3论文时,第一个CONV2d层在那里,filter_size=3,步幅=1,输出大小为256*256…

有人能给我介绍一下YOLO培训部分在这里是如何工作的吗?

来自Yolov3论文:

  • 如果您想要最佳精度/mAP,则在配置中使用608 x 608作为输入层大小
  • 如果你想要以准确性为代价的良好推理/速度,那么使用320 x 320
  • 如果您想要平衡模型,则使用416 x 416

请注意,第一层会自动将图像的大小调整为Yolov3CNN中第一层的大小,因此无需将1280 x 720图像转换为输入层的大小。

建议你阅读以下内容:

  • 要了解Yolov3的工作原理,请阅读此博客文章
  • 要了解一些从原始网站阅读的基本内容
  • 在这里学习如何训练您的自定义对象检测器

最新更新