目前我正在研究神经网络。我尝试使用不同的模型来识别人,并遇到了一个非常有趣的问题。我使用了yolo v3,掩码r-cnn,但是从间接角度拍摄的照片中的所有人都错过了照片中的人。现有模型中哪一个最准确和有效?
这是深度学习模型的主要问题。对于要检测的每个对象实例,训练集中至少应该有一个与之相似的对象(角度、大小、颜色、形状等(。训练数据中的相似对象越多,要检测到的对象的可能性就越高。
在速度和准确性方面,YOLO V3是目前最好的之一。如果你想要对象的确切边界(分割(,Mask RCNN也是最好的模型之一。如果不需要对象的确切边界,我建议使用 YOLO 来提高其效率,您可以处理您的训练数据并尝试添加具有不同大小、角度、形状的人的多个实例,还包括截断和遮挡的情况(当只有人的一部分可见时(以获得模型性能的更多泛化。