我正在尝试在我的自定义数据集上实现 YOLOv2。每个类是否需要最少的图像数量?
每个类没有用于训练的最低图像数。当然,您拥有的数字越低,模型就会慢慢收敛,精度会很低。
根据 Alexey(流行的分叉暗网和 YOLO v4 的创建者)如何改进对象检测,重要的是:
对于要检测的每个对象 - 必须至少有 1 个 训练数据集中的类似对象,具有大致相同的:形状, 物体的侧面,相对大小,旋转角度,倾斜度,照明。 如此理想,您的训练数据集包含对象为 不同:比例,旋转,照明,从不同的侧面,在 不同的背景 - 你最好有2000个不同的背景 每个类或更多类的图像,您应该训练2000*类 迭代次数或更多次
https://github.com/AlexeyAB/darknet
因此,我认为如果您想获得最佳精度,每类至少应该有 2000 张图像。但是每班1000也不错。即使每个类有数百张图像,您仍然可以获得体面(不是最佳)的结果。只需收集尽可能多的图像即可。
这取决于。
每个类至少有一个目标图像。原则上,如果使用数据增强策略并微调预训练的 YOLO 网络,这可能会具有一定的准确性。
然而,客观现实是,根据您的问题,每类可能需要多达 1000 张图像。