物体识别与检测与分类？有什么区别？

我不知道这是否是正确的堆栈交换论坛在哪里问这个问题，如果不是这种情况，请告诉我。

我正在开发一个应用程序，它给定一个包含绘画的输入图像作为输入，它能够告诉您绘画的标题。类似的情况是：给定包含建筑物的输入图像，返回的结果是建筑物的名称。

这是什么应用？在第一次撞击时，我会说"图像分类"之类的东西。我不是计算机视觉方面的专家，但我一直认为"图像分类"类似于"给定一个图像，告诉我这个图像中包含什么"。

另一方面，对象检测定义似乎与识别类的对象(例如建筑物)而不是类本身的实例(例如长城)更相关：

物体检测是一种与计算机视觉相关的计算机技术以及处理检测语义实例的图像处理特定类别的对象(例如人类、建筑物或汽车) 数字图像和视频。

关于对象识别：

物体

识别是感知物体物理的能力属性(如形状、颜色和纹理)和应用语义属性(例如将对象标识为苹果)。

我真的不知道如何对我描述的应用程序进行分类(开什么玩笑......)。你觉得怎么样？

简单地解释一下：你要去森林，天已经完全黑了。突然间，你看到了与背景不同的东西(纯黑)。这称为检测。

1)出现了与您的背景不同的内容。所以你检测到了。

2)现在走近，你确定它是一种动物。啊。。现在您已经分类/识别。它也可能是人类。

3)现在它越来越近了，现在你看到它是一只鹿。所以，现在你确定了它。

因此，序列是"检测到 ->识别/分类 ->识别"。

"身份识别是最后一个外壳，你可以用你的身份证记住这一点，你的脸(被识别)，并被归类为(人类)。

对象检测：- 检测图像中的对象。它不会提供有关对象是什么的信息。换句话说，对象检测的输出是包含对象的边界框的 x，y、宽度、高度。

对象分类：- 告诉对象是什么，例如猫，狗车等。换句话说，在分类或识别输出中将是一个类标签。

我正在开发一个应用程序，它给定一个包含绘画的输入图像作为输入，它能够告诉您绘画的标题。类似的情况是：给定包含建筑物的输入图像，返回的结果是建筑物的名称。

对于您的问题，更适合的是"草图分类">

相关内容