在OpenCV中使用GPU进行对象检测的HOG功能



在我的项目中,我正在计算同一图像中不同级别的GPU上的HOG功能。我的目标是探测以下物体
1.卡车
2.汽车
3.人员
最重要的问题是在多类对象检测器的情况下窗口大小的选择。这篇文章提供了一个很好的基础,但在多类特征的情况下,它并没有为窗口大小的选择提供答案
为了解决这个问题,我计算了每个正图像在不同级别/分辨率下的HOG特征,保持窗口大小(48*96)相同,但每个图像的文件约为600MB,这太大了
请告诉我如何在多类对象检测的情况下选择窗口大小、块大小和单元格大小。这是我用来计算HOG特征的代码。

void App::run()
{
    unsigned int count = 1;
    FileStorage fs;
    running = true;
    //int width;
    //int height;
    Size win_size(args.win_width, args.win_width * 2); 
    Size win_stride(args.win_stride_width, args.win_stride_height);
    cv::gpu::HOGDescriptor gpu_hog(win_size, Size(16, 16), Size(8, 8), Size(8, 8), 9,
                                   cv::gpu::HOGDescriptor::DEFAULT_WIN_SIGMA, 0.2, gamma_corr,
                                   cv::gpu::HOGDescriptor::DEFAULT_NLEVELS);
    VideoCapture vc("/home/ubuntu/Desktop/getdescriptor/images/image%d.jpg");
    Mat frame;
    Mat Left;
    Mat img_aux, img, img_to_show, img_new;
    cv::Mat temp;
    gpu::GpuMat gpu_img, descriptors, new_img;
    char cbuff[20];

    while (running)
    {
        vc.read(frame);

        if (!frame.empty())
        {
            workBegin();
            width  = frame.rows;
            height = frame.cols;
            sprintf (cbuff, "%04d", count);
            // Change format of the image
            if (make_gray) cvtColor(frame, img_aux, CV_BGR2GRAY);
            else if (use_gpu) cvtColor(frame, img_aux, CV_BGR2BGRA);
            else Left.copyTo(img_aux);
            // Resize image
            if (args.resize_src) resize(img_aux, img, Size(args.width, args.height));
            else img = img_aux;
            img_to_show = img;
            gpu_hog.nlevels = nlevels;
            hogWorkBegin();
            if (use_gpu)
            {
                gpu_img.upload(img);
                new_img.upload(img_new);
                fs.open(cbuff, FileStorage::WRITE);

                for(int levels = 0; levels < nlevels; levels++)
                {
                gpu_hog.getDescriptors(gpu_img, win_stride, descriptors, cv::gpu::HOGDescriptor::DESCR_FORMAT_ROW_BY_ROW);
                descriptors.download(temp);
                //printf("size %d %dn", temp.rows, temp.cols);
                fs <<"level" << levels;                
                fs << "features" << temp;
                cout<<"("<<width<<","<<height<<")"<<endl;
                width =  round(width/scale);
                height = round(height/scale);
                if( width < win_size.width || height < win_size.height )
                break;
                cout<<"Levels "<<levels<<endl;
                resize(img,img_new,Size(width,height));
                scale *= scale;
                }
                cout<<count<< " Image feature calculated !"<<endl;
                count++;
                //width = 640; height = 480;
                scale = 1.05;
            }
            hogWorkEnd();
            fs.release();
          }
           else  running = false;
       }
} 

应该选择窗口大小,特别是要检测的对象适合窗口。如果你想为不同的类型设置不同的窗口大小,这可能会变得棘手。

通常你要做的是以下

  1. 获取每种类型对象的训练数据,并使用在对象的已知位置提取的特征训练[对象类型的数量]许多模型
  2. 然后,您获取每个测试图像,并使用滑动窗口方法提取每个位置的特征。然后将这些特征与每个模型进行比较。如果其中一个模型的得分高于某个阈值,则您已找到该对象。如果不止一个模型的得分高于阈值,只需取得分最高的一个

如果你想使用不同大小的检测窗口,你会得到不同大小的特征向量(根据HoG特征的性质)。棘手的是,在测试阶段,您必须使用与您使用的对象类型一样多的滑动窗口。这肯定会起作用,但你必须对每个测试图像进行多次处理,从而导致更高的处理时间)

回答你们关于尺寸的问题:我不能给你们任何价值,它总是取决于你们的形象。使用上面提到的图像金字塔是处理不同比例对象的好方法。

  • 窗口大小:整个对象应该适合;必须可以被块大小整除
  • 块大小必须可以被单元格大小整除

HoG特征可视化的示例代码可以在这里找到。这也有助于理解特征向量的外观。

编辑:艰难地发现,单元格大小只允许使用cv::Size(8,8)。请参阅文档。

相关内容

  • 没有找到相关文章

最新更新