如何改进具有线性 SVM 性能的 HOG 探测器,用于汽车检测



所以,我想从行车记录仪录制的视频中检测汽车。我读了很多书,做了很多研究,但仍然没有完全理解。我确实考虑使用带有线性 SVM 的 HOG 描述符。但是,由于这对我来说是一种研究,因此它仍然可以以何种方式改进以使其更容易实施和更健壮?我正在考虑将另一种技术/算法与 HOG 相结合,但仍然有点迷失。我在这方面很陌生。

任何帮助将不胜感激。我也愿意接受其他更好的想法。

HOG(定向梯度直方图)只是一种可以从您的数据中计算的某种类型的特征向量。计算图像中每个像素处的渐变矢量,然后将可能的角度划分为离散数量的条柱。在给定的图像子区域中,将指向给定方向的梯度的总量级添加为包含该方向的相关角度条柱的条目。

这将给您留下一个向量,其长度等于您选择用于划分角度范围的条柱数,并充当非归一化直方图。

如果要计算同一子区域的其他图像特征,例如像素的总和、锐角或线条的某些测量、颜色分布的各个方面等,则可以根据需要计算任意数量的图像特征,将它们排列成一个长向量,然后简单地将该特征向量与 HOG 向量连接起来。

您可能还希望针对多个不同的尺度级别重复计算 HOG 向量,以帮助捕获一些尺度变异性,将每个特定于尺度的 HOG 向量连接到整个特征向量上。还有其他特征概念,如 SIFT 和其他概念,这些概念是为了自动考虑尺度不变性而创建的。

您可能需要进行一些规范化或扩展,您可以在任何标准 SVM 指南中阅读。标准的 LIBSVM 指南是一个很好的起点。

您必须小心正确组织特征向量,

因为特征向量可能具有非常多的分量,并且必须确保始终计算它们并将其置于相同的顺序中,并经过完全相同的缩放或归一化处理。

最新更新