人工智能 | 人脸识别研究报告(技术篇——人脸数据库)

版权声明:本文为博主原创文章,未经博主允许不得转载。转载注明文章出处!!! https://blog.csdn.net/u011344545/article/details/89737573

博主github:https://github.com/MichaelBeechan
博主CSDN:https://blog.csdn.net/u011344545

============================================
概念篇:https://blog.csdn.net/u011344545/article/details/89737370
技术篇:https://blog.csdn.net/u011344545/article/details/89737573
人才篇:
应用篇:

============================================
清华AMiner团队 AMiner.org

人脸识别技术原理。研究首先介绍了人脸识别的五大技术流程,包括人脸图像的采集与预处理、人脸检测、人脸特征提取、人脸识别和活体鉴别;其次,研究介绍了目前人脸识别的主要方法,包括基于特征脸的方法、基于几何特征的方法、基于深度学习的方法、基于支持向量机的方法和其他综合方法;第三,我们介绍了人脸识别的三大经典算法,分别为特征脸法、局部二值模式和 Fisherface,并简要概括了关于这三大经典算法的经典论文,供读者有更好的了解。最后,随着人脸识别技术的发展,不同的研究机构发展出了不同的人脸数据库,研究列出其中部分供读者参考和探索。

1、人脸识别流程

人脸识别技术原理简单来讲主要是三大步骤:一是建立一个包含大批量人脸图像的数据库,二是通过各种方式来获得当前要进行识别的目标人脸图像,三是将目标人脸图像与数据库中既有的人脸图像进行比对和筛选。
根据人脸识别技术原理具体实施起来的技术流程则主要包含以下四个部分,即人脸图像的采集与预处理、人脸检测、人脸特征提取、人脸识别和活体鉴别。
在这里插入图片描述
1.1 人脸图像的采集与预处理
人脸图像的采集与检测具体可分为人脸图像的采集和人脸图像的检测两部分内容。
人脸图像的采集
采集人脸图像通常情况下有两种途径,分别是既有人脸图像的批量导入和人脸图像的实时采集。一些比较先进的人脸识别系统甚至可以支持有条件的过滤掉不符合人脸识别质量要求或者是清晰度质量较低的人脸图像,尽可能的做到清晰精准的采集。
既有人脸图像的批量导入:即将通过各种方式采集好的人脸图像批量导入至人脸识别系统,系统会自动完成逐个人脸图像的采集工作。
人脸图像的实时采集:即调用摄像机或摄像头在设备的可拍摄范围内自动实时抓取人
脸图像并完成采集工作。
人脸图像的预处理
人脸图像的预处理的目的是在系统对人脸图像的检测基础之上,对人脸图像做出进一步
的处理以利于人脸图像的特征提取。
人脸图像的预处理具体而言是指对系统采集到的人脸图像进行光线、旋转、切割、过滤、降噪、放大缩小等一系列的复杂处理过程来使得该人脸图像无论是从光线、角度、距离、大小等任何方面来看均能够符合人脸图像的特征提取的标准要求。
在现实环境下采集图像,由于图像受到光线明暗不同、脸部表情变化、阴影遮挡等众多
人脸图像的采集与预处理人脸检测人脸特征提取人脸识别 活体鉴别外在因素的干扰,导致采集图像质量不理想,那就需要先对采集到的图像预处理,如果图像预处理不好,将会严重影响后续的人脸检测与识别。研究介绍三种图像预处理手段,即灰度调整、图像滤波、图像尺寸归一化等。
在这里插入图片描述
在这里插入图片描述
1.2 人脸检测
一张包含人脸图像的图片通常情况下可能还会包含其他内容,这时候就需要进行必要的人脸检测。也就是在一张人脸图像之中,系统会精准的定位出人脸的位置和大小,在挑选出有用的图像信息的同时自动剔除掉其他多余的图像信息来进一步的保证人脸图像的精准采集。
人脸检测是人脸识别中的重要组成部分。人脸检测是指应用一定的策略对给出的图片或者视频来进行检索,判断是否存在着人脸,如果存在则定位出每张人脸的位置、大小与姿态的过程。人脸检测是一个具有挑战性的目标检测问题,主要体现在两方面:
人脸目标内在的变化引起:(1)人脸具有相当复杂的细节变化和不同的表情(眼、嘴的开与闭等),不同的人脸具有不同的外貌,如脸形、肤色等;(2)人脸的遮挡,如眼镜、头发和头部饰物等。
外在条件变化引起:(1)由于成像角度的不同造成人脸的多姿态,如平面内旋转、深度旋转以及上下旋转等,其中深度旋转影响较大;(2)光照的影响,如图像中的亮度、对比度的变化和阴影等;(3)图像的成像条件,如摄像设备的焦距、成像距离等。
人脸检测的作用,便是在一张人脸图像之中,系统会精准的定位出人脸的位置和大小,
在挑选出有用的图像信息的同时自动剔除掉其他多余的图像信息来进一步的保证人脸图像的精准采集。人脸检测重点关注以下指标:
检测率:识别正确的人脸/图中所有的人脸。检测率越高,检测模型效果越好;
误检率:识别错误的人脸/识别出来的人脸。误检率越低,检测模型效果越好;
漏检率:未识别出来的人脸/图中所有的人脸。漏检率越低,检测模型效果越好;
速度:从采集图像完成到人脸检测完成的时间。时间越短,检测模型效果越好。
目前的人脸检测方法可分为三类,分别是基于肤色模型的检测、基于边缘特征的检测、基于统计理论方法 1 ,下面将对其进行简单的介绍:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
1.3 人脸特征提取
目前主流的人脸识别系统可支持使用的特征通常可分为人脸视觉特征人脸图像像素统计特征等,而人脸图像的特征提取就是针对人脸上的一些具体特征来提取的。特征简单,匹配算法则简单,适用于大规模的建库;反之,则适用于小规模库。特征提取的方法一般包括基于知识的提取方法或者基于代数特征的提取方法。
以基于知识的人脸识别提取方法中的一种为例,因为人脸主要是由眼睛、额头、鼻子、耳朵、下巴、嘴巴等部位组成,对这些部位以及它们之间的结构关系都是可以用几何形状特征来进行描述的,也就是说每一个人的人脸图像都可以有一个对应的几何形状特征,它可以帮助我们作为识别人脸的重要差异特征,这也是基于知识的提取方法中的一种。

1.4 人脸识别
我们可以在人脸识别系统中设定一个人脸相似程度的数值,再将对应的人脸图像与系统数据库中的所有人脸图像进行比对,若超过了预设的相似数值,那么系统将会把超过的人脸图像逐个输出,此时我们就需要根据人脸图像的相似程度高低和人脸本身的身份信息来进行精确筛选,这一精确筛选的过程又可以分为两类:其一是一对一的筛选,即对人脸身份进行确认过程;其二是一对多的筛选,即根据人脸相似程度进行匹配比对的过程。

1.5 活体鉴别
生物特征识别的共同问题之一就是要区别该信号是否来自于真正的生物体,比如,指纹识别系统需要区别带识别的指纹是来自于人的手指还是指纹手套,人脸识别系统所采集到的人脸图像,是来自于真实的人脸还是含有人脸的照片。因此,实际的人脸识别系统一般需要增加活体鉴别环节,例如,要求人左右转头,眨眼睛,开开口说句话等。

2、人脸识别主要方法

人脸识别技术的研究是一个跨越多个学科领域知识的高端技术研究工作,其包括多个学科的专业知识,如图像处理、生理学、心理学、模式识别等知识。在人脸识别技术研究的领域中,目前主要有几种研究的方向,如:一种是根据人脸特征统计学的识别方法,其主要有特征脸的方法以及隐马尔科夫模型(HMM,Hidden Markov Model)方法等;另一种人脸识别方法是关于连接机制的,主要有人工神经网络(ANN,Artificial Neural Network)方法和支持向量机(SVM,Support Vector Machine)方法等;还有一个就是综合多种识别方式的方法。

2.1 基于特征脸的方法
特征脸的方法是一种比较经典而又应用比较广的人脸识别方法,其主要原理是把图像做降维算法,使得数据的处理更容易,同时,速度又比较快。特征脸的人脸识别方法,实际上是将图像做 Karhunen-Loeve 变换,把一个高维的向量转化为低维的向量,从而消除每个分量存在的关联性,使得变换得到的图像与之对应特征值递减。在图像经过 K-L 变换后,其具有很好的位移不变性和稳定性。所以,特征脸的人脸识别方法具有方便实现,并且可以做到速度更快,以及对正面人脸图像的识别率相当高等优点。但是,该方法也具有不足的地方,就是比较容易受人脸表情、姿态和光照改变等因素的影响,从而导致识别率低的情况。

2.2 基于几何特征的方法
基于几何特征的识别方法是根据人脸面部器官的特征及其几何形状进行的一种人脸识别方法,是人们最早研究及使用的识别方法,它主要是采用不同人脸的不同特征等信息进行匹配识别,这种算法具有较快的识别速度,同时,其占用的内存也比较小,但是,其识别率也并不算高。该方法主要做法是首先对人脸的嘴巴、鼻子、眼睛等人脸主要特征器官的位置和大小进行检测,然后利用这些器官的几何分布关系和比例来匹配,从而达到人脸识别。
基于几何特征识别的流程大体如下:首先对人脸面部的各个特征点及其位置进行检测,如鼻子、嘴巴和眼睛等位置,然后计算这些特征之间的距离,得到可以表达每个特征脸的矢量特征信息,例如眼睛的位置,眉毛的长度等,其次还计算每个特征与之相对应关系,与人脸数据库中已知人脸对应特征信息来做比较,最后得出最佳的匹配人脸。基于几何特征的方法符合人们对人脸特征的认识,另外,每幅人脸只存储一个特征,所以占用的空间比较小;同时,这种方法对光照引起的变化并不会降低其识别率,而且特征模板的匹配和识别率比较高。但是,基于几何特征的方法也存在着鲁棒性不好,一旦表情和姿态稍微变化,识别效果将大打折扣。

2.3 基于深度学习的方法
深度学习的出现使人脸识别技术取得了突破性进展。人脸识别的最新研究成果表明,深度学习得到的人脸特征表达具有手工特征表达所不具备的重要特性,例如它是中度稀疏的、对人脸身份和人脸属性有很强的选择性、对局部遮挡具有良好的鲁棒性。这些特性是通过大数据训练自然得到的,并未对模型加入显式约束或后期处理,这也是深度学习能成功应用在人脸识别中的主要原因。
深度学习在人脸识别上有 7 个方面的典型应用:基于卷积神经网络(CNN)的人脸识别方法深度非线性人脸形状提取方法基于深度学习的人脸姿态鲁棒性建模有约束环境中的全自动人脸识别基于深度学习的视频监控下的人脸识别基于深度学习的低分辨率人脸识别及其他基于深度学习的人脸相关信息的识别
其中,卷积神经网络(Convolutional Neural Networks,CNN)是第一个真正成功训练多层网络结构的学习算法,基于卷积神经网络的人脸识别方法是一种深度的监督学习下的机器学习模型,能挖掘数据局部特征,提取全局训练特征和分类,其权值共享结构网络使之更类似于生物神经网络,在模式识别各个领域都得到成功应用。CNN 通过结合人脸图像空间的局部感知区域、共享权重、在空间或时间上的降采样来充分利用数据本身包含的局部性等特征,优化模型结构,保证一定的位移不变性。
利用 CNN 模型,香港中文大学的 Deep ID 项目以及 Facebook 的 Deep Face 项目在 LFW数据库上的人脸识别正确率分别达 97.45%和 97.35%只比人类视觉识别 97.5%的正确率略低。在取得突破性成果之后,香港中文大学的 DeepID2 项目将识别率提高到了99.15%。Deep ID2通过学习非线性特征变换使类内变化达到最小,而同时使不同身份的人脸图像间的距离保持恒定,超过了目前所有领先的深度学习和非深度学习算法在 LFW 数据库上的识别率以及人类在该数据库的识别率。深度学习已经成为计算机视觉中的研究热点,关于深度学习的新算法和新方向不断涌现,并且深度学习算法的性能逐渐在一些国际重大评测比赛中超过了浅层学习算法。

2.4 基于支持向量机的方法
将支持向量机(SVM)的方法应用到人脸识别中起源于统计学理论,它研究的方向是如何构造有效的学习机器,并用来解决模式的分类问题。其特点是将图像变换空间,在其他空间做分类。
支持向量机结构相对简单,而且可以达到全局最优等特点,所以,支持向量机在目前人脸识别领域取得了广泛的应用。但是,该方法也和神经网络的方法具有一样的不足,就是需要很大的存储空间,并且训练速度还比较慢。

2.5 其他综合方法
以上几种比较常用的人脸识别方法,我们不难看出,每一种识别方法都不能做到完美的识别率与更快的识别速度,都有着各自的优点和缺点,因此,现在许多研究人员则更喜欢使用多种识别方法综合起来应用,取各种识别方法的优势,综合运用,以达到更高的识别率和识别效果。

3、人脸识别三大经典算法

3.1 特征脸法(Eigenface)
特征脸技术是近期发展起来的用于人脸或者一般性刚体识别以及其它涉及到人脸处理的一种方法。使用特征脸进行人脸识别的方法首先由 Sirovich 和 Kirby(1987)提出(《Low-dimensional procedure for the characterization of human faces》),并由 Matthew Turk 和 AlexPentland 用于人脸分类(《Eigenfaces for recognition》)。首先把一批人脸图像转换成一个特征向量集,称为“Eigenfaces”,即“特征脸”,它们是最初训练图像集的基本组件。识别的过程是把一副新的图像投影到特征脸子空间,并通过它的投影点在子空间的位置以及投影线的长度来进行判定和识别。
将图像变换到另一个空间后,同一个类别的图像会聚到一起,不同类别的图像会聚力比较远,在原像素空间中不同类别的图像在分布上很难用简单的线或者面切分,变换到另一个空间,就可以很好的把他们分开了。Eigenfaces 选择的空间变换方法是 PCA(主成分分析),利用 PCA 得到人脸分布的主要成分,具体实现是对训练集中所有人脸图像的协方差矩阵进行本征值分解,得到对应的本征向量,这些本征向量就是“特征脸”。每个特征向量或者特征脸相当于捕捉或者描述人脸之间的一种变化或者特性。这就意味着每个人脸都可以表示为这些特征脸的线性组合。

3.2 局部二值模式( Local Binary Patterns , LBP )
局部二值模式(Local Binary Patterns LBP)是计算机视觉领域里用于分类的视觉算子。LBP 一种用来描述图像纹理特征的算子,该算子由芬兰奥卢大学的 T.Ojala 等人在 1996 年提 出 (《 A comparative study of texture measures with classification based on featured distributions》)。2002 年,T.Ojala 等人在 PAMI 上又发表了一篇关于 LBP 的文章(《Multiresolution gray-scale and rotation invariant texture classification with local binary patterns》)。这一文章非常清楚的阐述了多分辨率、灰度尺度不变和旋转不变、等价模式的改进的 LBP 特征。LBP 的核心思想就是:以中心像素的灰度值作为阈值,与他的领域相比较得到相对应的二进制码来表示局部纹理特征。
LBP 是提取局部特征作为判别依据的。LBP 方法显著的优点是对光照不敏感,但是依然没有解决姿态和表情的问题。不过相比于特征脸方法,LBP 的识别率已经有了很大的提
升。

3.3 Fisherface
线性鉴别分析在降维的同时考虑类别信息,由统计学家Sir R. A. Fisher1936年发明(《The use of multiple measurements in taxonomic problems》)。为了找到一种特征组合方式,达到最大的类间离散度和最小的类内离散度。这个想法很简单:在低维表示下,相同的类应该紧紧的聚在一起,而不同的类别尽量距离越远。1997 年,Belhumer 成功将 Fisher 判别准则应用于人脸分类,提出了基于线性判别分析的 Fisherface 方法(《Eigenfaces vs. fisherfaces:Recognition using class specific linear projection》)。

4、常用的人脸数据库

FERET 人脸数据库
由 FERET 项目创建,此图像集包含大量的人脸图像,并且每幅图中均只有一个人脸。该集中,同一个人的照片有不同表情、光照、姿态和年龄的变化。包含 1 万多张多姿态和光照的人脸图像,是人脸识别领域应用最广泛的人脸数据库之一。其中的多数人是西方人,每个人所包含的人脸图像的变化比较单一。

CMU Multi-- PIE 人脸数据库
由美国卡耐基梅隆大学建立。所谓“PIE”就是姿态(Pose),光照(Illumination)和表情(Expression)的缩写。CMU Multi-PIE 人脸数据库是在 CMU-PIE 人脸数据库的基础上发展起来的。包含 337 位志愿者的 75000 多张多姿态,光照和表情的面部图像。其中的姿态和光照变化图像也是在严格控制的条件下采集的,目前已经逐渐成为人脸识别领域的一个重要的测试集合。

YALE 人脸数据库(美国,耶鲁大学)
由耶鲁大学计算视觉与控制中心创建,包含 15 位志愿者的 165 张图片,包含光照、表
情和姿态的变化。
Yale 人脸数据库中一个采集志愿者的 10 张样本,相比较 ORL 人脸数据库 Yale 库中每
个对象采集的样本包含更明显的光照、表情和姿态以及遮挡变化。

YALE 人脸数据库 B
包含了 10 个人的 5850 幅在 9 种姿态,64 种光照条件下的图像。其中的姿态和光照变化的图像都是在严格控制的条件下采集的,主要用于光照和姿态问题的建模与分析。由于采集人数较少,该数据库的进一步应用受到了比较大的限制。

MIT人脸数据库

ORL人脸数据库

BioID 人脸数据库

UMIST图像集

年龄识别数据集 IMDB- - WIKI

Humaine - a collection of emotional databases

AR Face Database (AR):

Butterfly Database (BDB)

CMU Frontal Face Database (CMUFF)

CMU PIE Database (CMUPIE)

CMU Profile Face Database (CMUPF)

CVL Database (CVL)

M2VTS Multimodal Face Database

MIT CBCL Car Database (MITC)

MIT CBCL Face Database (MITF)

MIT CBCL Face Recognition Database

MIT CBCL Pedestrian Database (MITP)

Object Recognition Database (ORDB):

ORL Database of Faces (ORL)

Pilot European Image Processing Archive (PEIPA)

Texture Database (TDB)

The Color FERET Database

The Extended M2VTS Database (XM2VTSDB )

The FERET Database

The Japanese Female Facial Expression (JAFFE) Database (JAFFE)

猜你喜欢

转载自blog.csdn.net/u011344545/article/details/89737573