不带标签/注释的对象检测



假设我有3张图片(一个苹果,一个橘子,一个香蕉)和另外1000张任意图片。我想做的是看看这1000个任意图像是否包含与前3个图像相似的对象,如果是,画一个边界框来指示这些对象。然而,这1003张图片或物体都没有标记,也没有任何注释。

我在互联网上做了一些研究,并试图找到一些深度学习对象检测方法(例如更快的R-CNN, YOLOv3),但我想不出它们如何与我的任务相关。

我还注意到有一个术语叫做模板匹配,但它似乎与深度学习关系不大。

我的问题是:

是否有好的方法或深度学习模型可以满足我的需求?

我将受益于任何预训练更快的R-CNN, YOLOv3模型?(例如,如果它们是由汽车、人、狗、猫的图像集训练的,这些有意义的特征是否也可以应用到新的领域?)

我想做的是看看这1000个任意图像是否包含与前3个图像相似的对象

你说的"相似"是什么意思?

如果你的意思是"我想看看这1000张图片是否包含目标类中的对象:橙子、苹果和香蕉",那么答案是:

  • 如果你的模型预先训练你的目标课程(橙色,苹果和香蕉),然后你可以使用这些预训练的模型来检测1003图像中的对象。你可以选择橘色,Apple和banana作为配置中的类名。

  • 如果你的预训练模型不是在你的目标类上训练,你只有1003张图像,你需要做所谓的微调,这是训练模型的最后一层。1003张图像可能不足以训练模型,您可能需要执行数据增强来扩展数据。此外,考虑使您的类平衡(意味着每个类具有相同数量的对象)。

对于接近"相似度得分"的东西,你可以考虑信心得分对于类x,这是边界框包含对象x的可能性。然而,这个信心分数主要取决于"训练有素的程度"。模型在x类上。例如,对于相同的图像,不同的模型的置信度评分可能不同。同样,同一模型在不同角度、光照和方向下对同一物体可能具有不同的置信度分数。因此,无论如何,对模型进行微调可能是一个更好的主意,这样它们就可以更加"健壮"。到目标类的任何表示。

最新更新