我计划使用YOLO来完成CNN监督回归任务。给定一个图像,预测它将被观看的次数。我倾向于使用YOLO,因为它是一个对象检测器。高浏览量的照片大多包含对象(人脸、动物、文本等),这些对象是YOLO最初训练的COCO数据集中的类。
我已经尝试使用冻结权重的预训练CNN模型(VGGNet, MobileNet等),但结果并不好。微调预训练模型的选项是不可能的,因为我没有计算资源来训练使用100K+图像x次,只是为了为我的问题创建一个好的模型。
YOLO
使用Darknet作为CNN主干/特征提取器。因此,您可能希望尝试预训练的Darknet作为特征提取器,并用回归器替换分类器。标准YOLO使用Darknet-53,而小型YOLO使用Darknet-19。