边界框的位置和大小不正确,如何提高其准确性?



我使用detectron2来解决分割任务,我试图将一个对象分为4类,所以我使用了COCO InstanceSegmentation/mask_rcnn_R50_FPN_3x.yaml。我已经应用了4种增强变换,经过训练,我得到了大约0.1全损。

但由于某些原因,bbox的精度在测试集上的一些图像上不是很好,框绘制得更大或更小,或者不覆盖整个对象

此外,有时预测器绘制的框很少,它假设虽然只有一个对象,但几乎没有不同的对象。

有什么建议可以提高它的准确性吗?

如何解决这个问题,有什么好的实践方法吗?

任何建议或参考资料都会有所帮助。

我建议如下:

  1. 确保你的训练集有你想要检测的各种大小的对象:通过这种方式,网络了解到对象的大小可以不同,并且不太容易过拟合(例如,检测器可以假设你的对象应该只有大的(
  2. 添加数据。与其应用所有类型的增强,不如尝试添加更多的数据。虽然只有一个对象,但检测到不同对象的现象让我相信你的网络并不能很好地推广。就我个人而言,我会选择每个类至少500个注释

最大的进步将通过(2(实现。

一旦你有了一个不错的基线,你也可以尝试增强。

最新更新