基于卷积神经网络的人脸表情识别综述

                  基于卷积神经网络的人脸表情识别

摘要:在日常的沟通与交流过程中,运用面部表情可以促使沟通交流变得更加顺畅,因此对于人类而言,进行面部表情的解读也是进行相关沟通交流内容获取的重要程序。随着科学技术的不断发展,人工智能在日常人类交流沟通中,运用的越发广泛,因此面部表情人工智能识别这一项技术的发展与创新也更加受到关注。本文将对卷积神经网络的人脸表情识别技术进行深入的研究与探析。

关键词:卷积神经网络;人脸表情识别;技术研究

引言:人脸表情识别技术其实是一种将计算机技术与生物学联系在一起的技术。这项技术的出现与创新,标志着人类未来的生活将会出现多种多样的交叉型学科研究,这也意味着人类未来的计算机技术发展,会有更多的可能性,但需要注意的是,想要使得人脸表情识别技术变得更加智能化,更加精准,仍然需要进行更加贴合实际人类需求趋向的技术改进,下文将从卷积神经网络的角度出发,来进行人脸表情识别技术的研究。

一、相关理论概述

想要对基于卷积神经网络的人脸表情识别进行深入的研究与探讨,就需要对神经网络理论以及人脸表情识别技术有一个更加深入的认知。

1.神经网络模型

所谓的神经网络理论中,神经网络模型是较为重要的组成部分,该模型能够对人脑的结构以及功能进行一个数据化的模拟反应。而神经网络中最基本的单位是神经元,因此要进行神经网络模型的构建,必须要对神经元的信息传递方式以及连接方式有一个深刻的认知。相关技术研究人员发现,使用神经网络训练的过程中要进行前向传播以及反向传播的训练。相关技术研究人员通过对人体神经网络日常信息反馈和分析的方式与方法研究,来进行数字化模拟的神经网络模型搭建。

2.卷积神经网络

卷积神经网络是人工神经网络的重要组成部分,它是一种十分高效的网络,需要通过多层的神经网络组合起来才能够进行运用。卷积神经网络有较为漫长的发展历史,随着人工智能技术的逐渐发展和创新,卷积神经网络的技术也逐渐达到了新的高度。在传统的神经网络工作原理中,仅仅只能够满足两层神经元之间的相互连接,但是在日常的计算机运算过程中,全链接层上的参数过多,因此这种传统神经网络的工作方式可能会导致整体的网络训练速度变得十分缓慢,甚至出现过拟合问题。而卷积神经网络则完美的规避了这些缺点,能够使得全链接层上的参数在计算机运行过程中有明显的减少,这样一来整个网络训练的速度就能够得到提升与稳定。在使用卷积神经网络进行图像认知识别的过程中,每个神经元只需要对图像的局部特征进行辨识,而不需要每个神经元都对整个图像的特征进行辨识,这不仅能够使得图像识别的精准程度得到提升,还能够使得图像识别的速度得到提升。因此相比较传统的神经网络在人脸表情识别方面的使用,卷积神经网络的使用会变得更加方便、快捷。
3.人脸表情识别理论

想要成功的进行人脸表情识别,要经历三个阶段,第1个阶段是人脸检测阶段,第2个阶段是人脸表情特征的提取阶段,第3个阶段是人脸表情的识别阶段。这三个阶段缺一不可,共同完成一次人脸表情的精准识别。所谓的人脸检测指的是在图像中精准的,找出人脸的位置,因此不论是第二步骤还是第三步骤的应用,都需要经历第一步骤,如果相关神经网络技术的应用,无法在图像中进行人脸位置的准确提取,那么第二步骤与第三步骤也就无从谈起。能够用来进行人脸检测的方式有很多,这里不进行一一的举例。在第一步骤完成之后,到了第二阶段,就需要进行人脸表情的特征提取,所谓人脸表情的特征,指的是面部肌肉以及纹理变化的相关特征数据化,通过数据化的呈现来进行准确的提取和分析。由于相关人脸表情识别技术不仅仅要运用在静态图像上,也需要运用到动态图像上。而运用到静态图像上的技术与运用到动态图像上的技术有些微的差别,因此相关技术人员必须要对不同的图像类型的人脸表情特征提取进行不同的基础研究。到了第3个步骤之后,由于已经有了提取出的人脸表情特征信息,因此该步骤只需要判断提取出来的特征属于哪一类别,便算是完成了整体的人脸表情识别。这一步骤的完成也可以通过好几种不同的算法来进行。总而言之,人脸表情识别方式以技术手段仍然有不断改进的可能,在卷积网络神经技术使用基础上进行人脸识别技术的使用,更能够保证其准确性。

二、相关网络结构研究
在卷积神经网络模型的使用过程中最常使用到的模型种类是AlexNet,这种卷积神经网络模型相比较传统的卷积神经网络模型,有十分重大的改进。具体而言,在传统的网络训练过程中,通常指使用一个GPU来帮助进行网络训练,这个时候的网络训练速度并不尽如人意。但在AlexNet这一卷积神经网络模型中,相关技术研究人员将GPU拓展到两个以上,这样一来,网络训练的速度就能够获得极大的提升。再者,在传统的卷积神经网络模型中,通常只有7层网络层数。一旦遇到较为复杂的运算就很可能会出现梯度弥散的状况,但如果将网络层数拓展到11层,那么相关的梯度弥散状况发生概率就会获得明显的降低。AlexNet网络结构的使用,就成功将网络层数拓展到了11层。使得相关网络结构更符合人类的使用期待。此外在这一类型的卷积神经网络模型搭建过程中,相关技术研究人员为了对反馈小的神经元进行抑制,使得反馈较为明显的神经元能够获得增强,相关技术研究人员还尝试添加了LRN层,帮助进行局部神经元的竞争机制创建,这样一来模型的泛化能力也得到了较为明显的提升。最后,由于传统的卷积神经网络在使用过程中很可能会出现过拟合情况,为了使得相关弊端能够得到较为精准的规避,相关技术研究人员开始尝试使用大数据量的imagenet机制来对过拟合情况进行控制。因此相比较传统的卷积神经网络模型而言,AlexNet的确更具优势。

三、进行数据库集建立

为了使得未来的人脸精准识别能够变得更加高效准确,有许多技术研究人员开始通过数据库的建立来进行人脸表情的搜索与整理。现有的人脸表情数据库在数据存储量上并不符合使用军机神经网络来帮助进行高效表情识别的期待,因此为了使得研究变得更加精准合理,应当建立能够使用卷积神经网络技术来进行人脸表情识别研究的人脸表情图像数据集。下文将对数据库集的建立进行深入的分析与研究。

1.进行原始数据的获取

想要使得相关人脸精准识别数据库更具典型性与代表性,在相关数据的收集过程中,就应当以认真负责的态度来确保相关数据的真实性。具体到人脸精准识别数据库的建立上,则表现为相关技术研究人员需要对人脸最具代表性的5大类表情:面无表情和微笑哭泣,惊讶,以及生气进行最为精准性的收集。其中微笑表情的面部特征是面部肌肉强有力的收缩,面颊向上,眼角下的皮肤略微有些松弛,眼角的鱼尾纹会起皱。而哭泣表情则是嘴巴张大,整个面部表情向下,眼睛紧闭或是上下眼皮靠拢。而到了生气这一表情的受气过程中,相关技术人员所需要进行关注的面部特征是眼睛睁大,瞳孔变小,以及上下牙齿咬合在一起。而所谓的面无表情就是从表情分析上看不出人类想要表达的情绪。惊讶表情则是,嘴唇张大,眼睛张大,瞳孔放大,都有这一类表情特征的图片则会被标记为惊讶。当然技术研究在进行相关面部图像表情采集的过程中,所需要运用到的采集技术有两种一种是爬虫采集,另一种是手动采集。手工采集是一种较为原始和传统的信息采集方式需要靠技术人员在互联网上进行手动的信息获取。而爬虫采集则颇为不同,爬虫采集只需要使用互联网爬虫技术并可以自动进行图像获取。
因此相比较手动采集而言,爬虫采集更符合现代化的网络信息技术发展趋向。较为常见的爬虫采集技术,可以分为网络链接爬取和图像数据爬取两种。在进行人脸表情数据库建立过程中所需要使用到的爬虫技术是图像数据爬取。能够准确无误的使用该技术,便可以更加真实的进行相关人员数据的获取和整理,这对进行相应数据库的建立是能够起到助力的。

2.进行数据预处理

倘若相关人脸表情识别的数据收集较为真实且高质量,要么在进行下一步的相应人脸表情数据识别过程中,相关识别效率就能够得到有效的提升。因此在进行数据库的建立过程中,进行人脸表情识别准确性的提升是很有必要的。需要注意的是,相关数据库中所收集的图像必须要是正面且无任何遮挡的人脸表情图像,相关技术研究人员倘若在进行图像收集时没有注意到这一特征,很可能会使得整个人脸表情数据库的建立质量受到影响。除此之外,在进行相应原始数据仓库之前,还需要对多余的背景信息进行剔除。因此在进行了相关图像信息的初步采集后,进行数据的预处理工作是十分有必要的。在数据的预处理工作完成后,还要炖,已经处理过的数据信息进行统一的尺寸修改以及格式修改和命名修改,通常情况下,人脸表情数据信息采集在进行了预处理过程后,都需要统一为JPG格式,并且相关的分辨率,也需要进行统一,通常情况下分辨率需要统一为227×27的模式,能够被当作原始的参照图像资料存入库中。在这一流程完毕后,相关的数据库建立便宣告完成。

四、进行AlexNet网络改进
虽然相比较传统的卷积神经网络模型而言,AlexNet具有无可比拟的优势,并且能够使得相关的人脸表情识别效率质量大大提升,但是在人工智能技术不断发展与改进的过程中,相关技术人员仍然发现AlexNet网络结构存在着一定的缺陷。例如使用该网络结构来对人脸表情进行识别实验,最终的精准程度是74.91%。就是说它能够识别大部分的人类面部表情,但却仍然存在误差,这意味着相关网络结构在卷积操作的特征提取过程中,所使用的卷积操作卷积核尺寸并不具备多样性。只想要在未来的卷积神经网络基础上进行人类面部表情识别,并且使得相关面部表情识别变得更加精准和高质量,就需要对现阶段所使用的AlexNet网络结构进行进一步的改进与完善。

结束语
总而言之,在人工智能技术不断发展与完善的过程中,想要使用卷积神经网络来进行而且面部表情的识别与抓取,并且使得相关识别质量与速率能够得到明显的改进,就需要不断结合人工智能技术的发展趋向来进行相关识别技术的完善,这项技术的改进,能够对人类的面部表情进行更好地解读,这样也会在一定程度上促进人与人之间的良好沟通,使得人类日常的生活和工作变得更加方便快捷。

参考文献:
[1]石翠萍,谭聪,左江,赵可新.基于改进AlexNet卷积神经网络的人脸表情识别[J].电讯技术,2020,60(09):1005-1012.
[2]郭昕刚,王帅,张培栋,梁锦明.连接卷积神经网络人脸表情识别算法[J].长春工业大学学报,2020,41(04):381-386.
[3]杨瀚霆. 基于轻量化卷积神经网络的人脸表情识别方法[D].北京建筑大学,2020.
[4]周涛. 基于卷积神经网络的静态图像人脸表情分类技术研究[D].内蒙古科技大学,2020.
[5]王帅. 基于卷积神经网络的人脸表情识别研究[D].长春工业大学,2020.
[6]辛阳阳. 基于深度学习的人脸表情识别方法的研究[D].山西大学,2020.
[7]冀聪聪. 基于卷积神经网络人脸表情识别的研究[D].广西师范大学,2020.

猜你喜欢

转载自blog.csdn.net/qq_39297053/article/details/109282109