不带标签/注释的对象检测

假设我有3张图片(一个苹果，一个橘子，一个香蕉)和另外1000张任意图片。我想做的是看看这1000个任意图像是否包含与前3个图像相似的对象，如果是，画一个边界框来指示这些对象。然而，这1003张图片或物体都没有标记，也没有任何注释。

我在互联网上做了一些研究，并试图找到一些深度学习对象检测方法(例如更快的R-CNN, YOLOv3)，但我想不出它们如何与我的任务相关。

我还注意到有一个术语叫做模板匹配，但它似乎与深度学习关系不大。

我的问题是:

是否有好的方法或深度学习模型可以满足我的需求?

我将受益于任何预训练更快的R-CNN, YOLOv3模型?(例如，如果它们是由汽车、人、狗、猫的图像集训练的，这些有意义的特征是否也可以应用到新的领域?)

我想做的是看看这1000个任意图像是否包含与前3个图像相似的对象

你说的"相似"是什么意思?

如果你的意思是"我想看看这1000张图片是否包含目标类中的对象:橙子、苹果和香蕉"，那么答案是:

如果你的模型预先训练你的目标课程(橙色，苹果和香蕉)，然后你可以使用这些预训练的模型来检测1003图像中的对象。你可以选择橘色，Apple和banana作为配置中的类名。
如果你的预训练模型不是在你的目标类上训练，你只有1003张图像，你需要做所谓的微调，这是训练模型的最后一层。1003张图像可能不足以训练模型，您可能需要执行数据增强来扩展数据。此外，考虑使您的类平衡(意味着每个类具有相同数量的对象)。

对于接近"相似度得分"的东西，你可以考虑信心得分对于类x，这是边界框包含对象x的可能性。然而，这个信心分数主要取决于"训练有素的程度"。模型在x类上。例如，对于相同的图像，不同的模型的置信度评分可能不同。同样，同一模型在不同角度、光照和方向下对同一物体可能具有不同的置信度分数。因此，无论如何，对模型进行微调可能是一个更好的主意，这样它们就可以更加"健壮"。到目标类的任何表示。

相关内容

最新更新

热门标签：