对大图像进行目标检测训练



尝试通过在4096 x 8192像素的图像上使用更快的RCNN来检测车牌。

我没有为训练调整大小,而是裁剪了图像的某些部分并标记了车牌并进行了训练,这样它就可以工作,但它无法检测实际图像,而只能检测小图像。

请指导我完成这样工作的最佳方式是什么。我应该如何提供训练,以及如何在faster_rcnn_inception_v2_pets.config上进行配置。或者,如果您认为更快的 RCNN 不适合此类工作,请提出更好的方法,我至少需要超过 %80 的准确度。

我在谷歌上搜索了很多,但找不到任何处理 8k 以上图像的人。

我也在下面附上一个示例图像。 https://ibb.co/NKWWd7q


我尝试在谷歌云服务器上对4096 x 8192 像素的图像进行注释训练,它在单个批量大小上消耗了超过 250gb 的 RAM。

亲切问候。

这是我的评论集合的答案:

与图像的其余部分相比,您的车牌似乎可能太小。

尝试首先使用例如YOLO提取汽车,提取它,然后再次运行车牌检测网络。请记住,您可能需要调整边界框(提取的汽车的大小)以适应您的网络输入大小。

可以在此处找到使用 YOLO 检测汽车的示例。

相关内容

  • 没有找到相关文章

最新更新