【OTB使用介绍三】如何将自己的算法加入到Visual Tracker Benchmark v1.0中,以KCF为例

在【OTB使用介绍二】中,简单的讲解了OTB的三个m文件,这次主要讲解如何将自己算法加入到OTB中

原OTB并没有包含KCF,所以这里以KCF为例子,介绍如何将自己的算法加入到OTB中,
KCF的源码可以去http://www.robots.ox.ac.uk/~joao/circulant/下载
KCF
点击matlab code 即可下载matlab版本的KCF。

下载完毕后,解压缩文件,并把KCF的matlab源码放到benchmark的文件夹trackers中。如图
这里写图片描述
然后打开util文件夹中的configTrackers.m,并将KCF跟踪算法添加到trackers1这个结构体中。添加的形式如下:

trackers1={ 
    struct('name','SRDCF','namePaper','SRDCF'),...
    struct('name','KCF','namePaper','KCF'),...
    struct('name','DSST','namePaper','DSST'),...
    struct('name','Struck','namePaper','Struck')};

说明一下configTrackers.m文件中放的是所有的跟踪算法。算法对比的添加删除都是在此完成。

最后也是最重要的一步

就是需要写一个将KCF的输入输出对接到benchmark中的脚本run_tracker.m文件,打开trackers文件夹中的其他算法时会发现每个算法中都会有 run_(这里是算法名字).m 文件,例如CT中的 run_CT.m

参照其它算法 例如:run_CT.m对比Runtracker.m文件 在第一行的输入和最后几行的输出进行统一,

function results=run_CT(seq, res_path, bSaveImage)

results.res=res;

results.type='rect';

results.fps=(seq.len-1)/duration;

disp(['fps: ' num2str(results.fps)])

其实,写的run_().m接口主要就是特别注意以上信息。其中seq包含的主要是测试序列的各种信息。
res_path 和 bSaveImage主要是保存的图片,即BB框画框图。
这里给出修改后KCF的run_KCF.m。删除了一些不必要的信息。

  function results = run_KCF(seq, res_path, bSaveImage)

    kernel_type = 'gaussian'; 
    kernel.type = kernel_type;

    padding = 1.5;  %extra area surrounding the target
    lambda = 1e-4;  %regularization
    output_sigma_factor = 0.1;  %spatial bandwidth (proportional to target)

    interp_factor = 0.02;
    kernel.sigma = 0.5; 
    kernel.poly_a = 1;
    kernel.poly_b = 9;  
    features.hog = true;
    features.hog_orientations = 9;
    cell_size = 4;  

    seq_KCF = seq;
    target_sz = seq_KCF.init_rect(1,[4,3]);
    pos = seq_KCF.init_rect(1,[2,1]) + floor(target_sz/2);
    img_files = seq_KCF.s_frames;
    video_path = [];

    %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
    [positions , time] = tracker(video_path, img_files, pos, target_sz, ...
            padding, kernel, lambda, output_sigma_factor, interp_factor, ...
            cell_size, features);
    %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%    
    if bSaveImage
        imwrite(frame2im(getframe(gcf)),[res_path num2str(frame) '.jpg']); 
    end

    %return results to benchmark, in a workspace variable
    rects = [positions(:,2) - target_sz(2)/2, positions(:,1) - target_sz(1)/2];
    rects(:,3) = target_sz(2);
    rects(:,4) = target_sz(1);

    fps = numel(img_files) / time;
    results.type = 'rect';
    results.res = rects;%each row is a rectangle
    results.fps = fps;

  end

因为测试的时候选择的是高斯核和hog特征,所以如果报错gray没设置就把features.gray设置为 false;

最后就是运行main_running.m函数。运行完main_running.m函数,得到的结果是在文件夹results中的results_SRE_CVPR13和results_TRE_CVPR13。(保存位置取决于你自己设置的位置)

猜你喜欢

转载自blog.csdn.net/devil_08/article/details/80065820