计算机视觉和机器学习中特征描述符的说明



我已经开始使用计算机视觉技术,主要是深度学习,但我想尝试对更传统的技术有一个很好的理解,以获得良好的基础。我一直在使用一些手动特征工程技术,使用 RF 和 SVM 分类器进行分类。我查看了纹理表示,如 HOG 和 LBP 描述符,以及边缘滤波器、gabor滤波器和空间特征,如傅里叶描述符。我缺乏的是关于不同功能如何分组以及它们各自属于哪些类别的好主意。我知道有些被定义为全球和本地,但这到底是什么意思,哪些?我应该考虑其他类别,如纹理和几何吗?任何解释都会有用且非常感谢(我在网上看了很多,但似乎有点碎片化(

谢谢!

特征是从图像中提取的数值信息,人类难以理解和关联。假设我们将图像视为数据,从数据中提取的信息称为特征。通常,从图像中提取的特征比原始图像的维度低得多。尺寸的降低减少了处理一堆图像的开销。

基本上,根据应用程序从图像中提取两种类型的特征。它们是本地和全局特征。特征有时称为描述符。全局描述符通常用于图像检索、对象检测和分类,而局部描述符用于对象识别/识别。检测和识别之间存在很大差异。检测是查找某物/物体的存在(查找图像/视频中是否存在对象(,而识别是查找对象的身份(识别人/物体(。

全局特征将图像描述为一个整体,以概括整个对象,其中局部特征描述对象的图像补丁(图像中的关键点(。全局要素包括等值线表示、形状描述符和纹理要素,局部要素表示影像面片中的纹理。形状矩阵,不变矩(Hu,Zerinke(,直方图定向梯度(HOG(和Co-HOG是全局描述符的一些例子。SIFT,SURF,LBP,BRISK,MSER和FREAK是本地描述符的一些例子。

通常,对于对象检测和分类等低级应用,使用全局特征,对于对象识别等高级应用,使用局部特征。全局和局部特征的结合提高了识别的准确性,并具有计算开销的副作用。

最新更新