我不知道这是否是正确的堆栈交换论坛在哪里问这个问题,如果不是这种情况,请告诉我。
我正在开发一个应用程序,它给定一个包含绘画的输入图像作为输入,它能够告诉您绘画的标题。类似的情况是:给定包含建筑物的输入图像,返回的结果是建筑物的名称。
这是什么应用?在第一次撞击时,我会说"图像分类"之类的东西。我不是计算机视觉方面的专家,但我一直认为"图像分类"类似于"给定一个图像,告诉我这个图像中包含什么"。
另一方面,对象检测定义似乎与识别类的对象(例如建筑物)而不是类本身的实例(例如长城)更相关:
物体检测是一种与计算机视觉相关的计算机技术 以及处理检测语义实例的图像处理 特定类别的对象(例如人类、建筑物或汽车) 数字图像和视频。
关于对象识别:
物体识别是感知物体物理的能力 属性(如形状、颜色和纹理)和应用语义 属性(例如将对象标识为苹果)。
我真的不知道如何对我描述的应用程序进行分类(开什么玩笑......)。你觉得怎么样?
简单地解释一下:你要去森林,天已经完全黑了。突然间,你看到了与背景不同的东西(纯黑)。这称为检测。
1)出现了与您的背景不同的内容。所以你检测到了。
2)现在走近,你确定它是一种动物。啊。。现在您已经分类/识别。它也可能是人类。
3)现在它越来越近了,现在你看到它是一只鹿。所以,现在你确定了它。
因此,序列是"检测到 ->识别/分类 ->识别"。
"身份识别是最后一个外壳,你可以用你的身份证记住这一点,你的脸(被识别),并被归类为(人类)。
对象检测 :- 检测图像中的对象。它不会提供有关对象是什么的信息。换句话说,对象检测的输出是包含对象的边界框的 x,y、宽度、高度。
对象分类:- 告诉对象是什么,例如猫,狗车等。换句话说,在分类或识别输出中将是一个类标签。
我正在开发一个应用程序,它给定一个包含绘画的输入图像作为输入,它能够告诉您绘画的标题。类似的情况是:给定包含建筑物的输入图像,返回的结果是建筑物的名称。
对于您的问题,更适合的是"草图分类">