Facial Landmarks Detector Learned by the Structured Output SVM

想把自己看的论文记录下来~这是一个提取面部特征点的方法~是用来进行眼镜检测方法中的一步,当时做眼睛检测时直接用了文中开源的作者训练好的模型。但还是想看一下论文,因为毕竟自己很水~~接下来一边看一边写吧,不懂得也会标出来。

一 摘要:

我们提出了一种基于可变形部件模型(DPM)的面部标志检测器的监督学习的原则性方法。我们将标志检测的任务视为结构化输出分类的一个实例。为了学习检测器的参数,我们使用结构化输出支持向量机算法。与先前的作品相比,学习算法的目标函数与检测器的性能直接相关,并由用户定义的损失函数控制。我们提出的检测器是在标准计算机上实时实现的,易于实现,并且易于修改,可用于检测各种标志。我们在具有挑战性的LFW数据库中评估我们的检测器的性能。实证结果表明,我们的检测器始终优于基于活动外观模型和DPM的两个主要公共方法的实现。我们正在发布实施我们提出的检测器的开源代码,以及LFW数据库中几乎所有图像的七个面部标志的手动注释。(来自谷歌翻译,再加上自己调整语法不同的地方,话说谷歌英译汉还是挺好用的呢~)

二 面部标志检测的结构化输出分类器

下面进入正题,本文提出的方法是基于DPM(Deformable Parts Model)的,这个方法没听过呢,求助百度,找了一篇讲解的比较详细的博客,链接如下:

http://www.voidcn.com/blog/tiandijun/article/p-5006216.html

接下来看看这篇论文里写了啥:

首先说了整个工作的输入和输出,输入是用人脸检测器截取到的bounding box并归一化(normalizing,翻译为归一化是不是不太好,我理解的这里的意思应该是resize为固定的大小)到固定大小。输出是一系列脸部标志点的位置。嗯,应该没什么毛病。

接下来给出了一些定义。(这里好像没有类似MathType的那种公式编辑器呀,写在word里也不能复制粘贴,好着急,毕竟第一次写呢)

嗯,最后是自己写了下拍了图片。。。。真low!!我有什么办法呢我也很无奈呀┑( ̄Д  ̄)┍(摔!老是提示服务器在维护,上传不了啦,等以后再上传,接着讲)


该函数度量了两部分之和:每一部分的匹配程度,部分间连接的变化程度(可以想象为弹簧的形变量)就是既能使每一部分匹配的好,又能使部分间的相对关系与模型尽可能的相符的那一个。

没法写了好多公式。。。。。。。我可以写在纸上发图片吗QAQ




猜你喜欢

转载自blog.csdn.net/yin_hei/article/details/68934620
svm