边界框的位置和大小不正确，如何提高其准确性？

我使用detectron2来解决分割任务，我试图将一个对象分为4类，所以我使用了COCO InstanceSegmentation/mask_rcnn_R50_FPN_3x.yaml。我已经应用了4种增强变换，经过训练，我得到了大约0.1全损。

但由于某些原因，bbox的精度在测试集上的一些图像上不是很好，框绘制得更大或更小，或者不覆盖整个对象。

此外，有时预测器绘制的框很少，它假设虽然只有一个对象，但几乎没有不同的对象。

有什么建议可以提高它的准确性吗？

如何解决这个问题，有什么好的实践方法吗？

任何建议或参考资料都会有所帮助。

我建议如下：

确保你的训练集有你想要检测的各种大小的对象：通过这种方式，网络了解到对象的大小可以不同，并且不太容易过拟合(例如，检测器可以假设你的对象应该只有大的(
添加数据。与其应用所有类型的增强，不如尝试添加更多的数据。虽然只有一个对象，但检测到不同对象的现象让我相信你的网络并不能很好地推广。就我个人而言，我会选择每个类至少500个注释

最大的进步将通过(2(实现。

一旦你有了一个不错的基线，你也可以尝试增强。

相关内容