什么是图像处理中的特征描述符(算法或描述)



我经常对图像特征上下文中术语描述符的含义感到困惑。描述符是对点的局部邻域的描述(例如浮点向量(,还是描述符是输出描述的算法?另外,特征提取器的输出究竟是什么?

这个问题我已经问自己很长时间了,我想出的唯一解释是描述符既是算法又是描述。特征检测器用于检测特征点。然而,特征提取器似乎没有任何意义。

那么,特征描述符是描述还是生成描述的算法?

特征检测器是一种算法,它获取图像并输出图像中重要区域的位置(即像素坐标(。这方面的一个例子是角落检测器,它输出图像中角落的位置,但不会告诉您有关检测到的特征的任何其他信息。

特征描述符

是一种获取图像并输出特征描述符/特征向量的算法。特征描述符将有趣的信息编码为一系列数字,并充当一种数字"指纹",可用于区分一个特征与另一个特征。理想情况下,此信息在图像转换下是不变的,因此即使图像以某种方式转换,我们也可以再次找到该特征。一个例子是SIFT,它对有关局部邻域图像梯度特征向量数字的信息进行编码。您可以阅读的其他示例是HOG和SURF。


编辑:当涉及到特征检测器时,"位置"可能还包括描述特征大小或比例的数字。这是因为在"放大"时看起来像角的东西在"缩小"时可能看起来不像角,因此指定比例信息非常重要。因此,与其仅使用(x,y)对作为"图像空间"中的位置,不如将三重(x,y,scale)作为"缩放空间"中的位置。

对于描述符,我理解为对图像上点邻域的描述。换句话说,它是图像中的一个向量(对图像中内容的视觉特征的描述(。

例如,HOG(定向渐变直方图(中有一种称为图像渐变和空间/方向合并的方法。Matlab中的extractHOGeatures和使用HOG的分类具有可视化示例,以便更好地理解。

最新更新