我已经从头开始实现了YOLOv3,我计划使用MS-COCO权重对一些不同的数据进行微调。我选择的数据集有720*1280大小的图像。
当我浏览YOLOv3论文时,第一个CONV2d层在那里,filter_size=3,步幅=1,输出大小为256*256…
有人能给我介绍一下YOLO培训部分在这里是如何工作的吗?
来自Yolov3论文:
- 如果您想要最佳精度/mAP,则在配置中使用
608 x 608
作为输入层大小 - 如果你想要以准确性为代价的良好推理/速度,那么使用
320 x 320
- 如果您想要平衡模型,则使用
416 x 416
请注意,第一层会自动将图像的大小调整为Yolov3
CNN中第一层的大小,因此无需将1280 x 720
图像转换为输入层的大小。
建议你阅读以下内容:
- 要了解Yolov3的工作原理,请阅读此博客文章
- 要了解一些从原始网站阅读的基本内容
- 在这里学习如何训练您的自定义对象检测器