在【OTB使用介绍二】中,简单的讲解了OTB的三个m文件,这次主要讲解如何将自己算法加入到OTB中
原OTB并没有包含KCF,所以这里以KCF为例子,介绍如何将自己的算法加入到OTB中,
KCF的源码可以去http://www.robots.ox.ac.uk/~joao/circulant/下载
点击matlab code 即可下载matlab版本的KCF。
下载完毕后,解压缩文件,并把KCF的matlab源码放到benchmark的文件夹trackers中。如图
然后打开util文件夹中的configTrackers.m,并将KCF跟踪算法添加到trackers1这个结构体中。添加的形式如下:
trackers1={
struct('name','SRDCF','namePaper','SRDCF'),...
struct('name','KCF','namePaper','KCF'),...
struct('name','DSST','namePaper','DSST'),...
struct('name','Struck','namePaper','Struck')};
说明一下configTrackers.m文件中放的是所有的跟踪算法。算法对比的添加删除都是在此完成。
最后也是最重要的一步
就是需要写一个将KCF的输入输出对接到benchmark中的脚本run_tracker.m文件,打开trackers文件夹中的其他算法时会发现每个算法中都会有 run_(这里是算法名字).m 文件,例如CT中的 run_CT.m
参照其它算法 例如:run_CT.m对比Runtracker.m文件 在第一行的输入和最后几行的输出进行统一,
function results=run_CT(seq, res_path, bSaveImage)
results.res=res;
results.type='rect';
results.fps=(seq.len-1)/duration;
disp(['fps: ' num2str(results.fps)])
其实,写的run_().m接口主要就是特别注意以上信息。其中seq包含的主要是测试序列的各种信息。
res_path 和 bSaveImage主要是保存的图片,即BB框画框图。
这里给出修改后KCF的run_KCF.m。删除了一些不必要的信息。
function results = run_KCF(seq, res_path, bSaveImage)
kernel_type = 'gaussian';
kernel.type = kernel_type;
padding = 1.5; %extra area surrounding the target
lambda = 1e-4; %regularization
output_sigma_factor = 0.1; %spatial bandwidth (proportional to target)
interp_factor = 0.02;
kernel.sigma = 0.5;
kernel.poly_a = 1;
kernel.poly_b = 9;
features.hog = true;
features.hog_orientations = 9;
cell_size = 4;
seq_KCF = seq;
target_sz = seq_KCF.init_rect(1,[4,3]);
pos = seq_KCF.init_rect(1,[2,1]) + floor(target_sz/2);
img_files = seq_KCF.s_frames;
video_path = [];
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
[positions , time] = tracker(video_path, img_files, pos, target_sz, ...
padding, kernel, lambda, output_sigma_factor, interp_factor, ...
cell_size, features);
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
if bSaveImage
imwrite(frame2im(getframe(gcf)),[res_path num2str(frame) '.jpg']);
end
%return results to benchmark, in a workspace variable
rects = [positions(:,2) - target_sz(2)/2, positions(:,1) - target_sz(1)/2];
rects(:,3) = target_sz(2);
rects(:,4) = target_sz(1);
fps = numel(img_files) / time;
results.type = 'rect';
results.res = rects;%each row is a rectangle
results.fps = fps;
end
因为测试的时候选择的是高斯核和hog特征,所以如果报错gray没设置就把features.gray设置为 false;
最后就是运行main_running.m函数。运行完main_running.m函数,得到的结果是在文件夹results中的results_SRE_CVPR13和results_TRE_CVPR13。(保存位置取决于你自己设置的位置)