基于改进MobileNetV2的人脸表情识别_严春满.pdf
《基于改进MobileNetV2的人脸表情识别_严春满.pdf》由会员分享,可在线阅读,更多相关《基于改进MobileNetV2的人脸表情识别_严春满.pdf(8页珍藏版)》请在咨信网上搜索。
1、 基于改进M o b i l e N e t V 2的人脸表情识别*严春满,张 翔,王青朋(西北师范大学物理与电子工程学院,甘肃 兰州 7 3 0 0 7 0)摘 要:针对现有深度卷积神经网络参数量庞大,导致人脸表情识别场景受限的问题,提出一种基于改进轻量级卷积神经网络的人脸表情识别模型。该模型以M o b i l e N e t V 2轻量级特征提取网络为主要框架,通过压缩网络宽度因子与整体维度,减少网络参数量与计算量;引入S a n d G l a s s模块对网络倒残差模块进行改进,减少特征信息在网络传输中的丢失;同时嵌入高效通道注意力机制,提高网络对于特征信息的提取能力。在人脸表情数据
2、集F E R 2 0 1 3和C K+上进行实验,所提网络模型的人脸表情识别准确率达到了6 8.9 6%与9 5.9 6%,分别高于M o b i l e N e t V 2 1.0 6%与6.1 4%,且参数量下降8 2.2 8%,实验结果验证了网络模型改进措施的有效性。关键词:人脸表情识别;轻量级网络;M o b i l e N e t V 2;倒残差模块;通道注意力中图分类号:T P 3 9 1.4 1文献标志码:Ad o i:1 0.3 9 6 9/j.i s s n.1 0 0 7-1 3 0 X.2 0 2 3.0 6.0 1 4F a c i a l e x p r e s s
3、i o n r e c o g n i t i o n b a s e d o n i m p r o v e d M o b i l e N e t V 2YAN C h u n-m a n,Z HANG X i a n g,WANG Q i n g-p e n g(C o l l e g e o f P h y s i c s a n d E l e c t r o n i c E n g i n e e r i n g,N o r t h w e s t N o r m a l U n i v e r s i t y,L a n z h o u 7 3 0 0 7 0,C h i n a
4、)A b s t r a c t:A i m i n g a t t h e p r o b l e m t h a t t h e e x i s t i n g d e e p c o n v o l u t i o n a l n e u r a l n e t w o r k h a s a l a r g e a-m o u n t o f p a r a m e t e r s,w h i c h l e a d s t o t h e l i m i t a t i o n o f f a c i a l e x p r e s s i o n r e c o g n i t i
5、 o n s c e n e s,t h i s p a p e r p r o p o s e s a f a c i a l e x p r e s s i o n r e c o g n i t i o n m o d e l b a s e d o n i m p r o v e d l i g h t w e i g h t c o n v o l u t i o n a l n e u r a l n e t-w o r k.T h e m o d e l t a k e s M o b i l e N e t V 2 l i g h t w e i g h t f e a t u
6、 r e e x t r a c t i o n n e t w o r k a s t h e m a i n f r a m e w o r k,b y c o m p r e s s i n g t h e n e t w o r k w i d t h f a c t o r a n d t h e g l o b a l d i m e n s i o n,t h e n u m b e r o f n e t w o r k p a r a m e t e r s a n d t h e a m o u n t o f c o m p u t a t i o n a r e r e
7、 d u c e d.S a n d G l a s s b l o c k i s i n t r o d u c e d t o i m p r o v e t h e r e v e r s e r e s i d u a l m o d u l e i n t h i s n e t w o r k,a n d r e d u c e t h e l o s s o f f e a t u r e i n f o r m a t i o n d u r i n g n e t w o r k t r a n s m i s s i o n.A t t h e s a m e t i m
8、 e,t h e e f f i c i e n t c h a n n e l a t t e n t i o n m e c h a n i s m i s e m b e d d e d t o i m p r o v e t h e n e t w o r k s a b i l i t y t o e x-t r a c t f e a t u r e i n f o r m a t i o n.E x p e r i m e n t s w e r e c a r r i e d o u t o n t h e f a c i a l e x p r e s s i o n d a
9、 t a s e t s F E R 2 0 1 3 a n d C K+.T h e f a c i a l e x p r e s s i o n a c c u r a c y r a t e o f t h e p r o p o s e d n e t w o r k r e a c h e s 6 8.9 6%a n d 9 5.9 6%,w h i c h a r e 1.0 6%a n d 6.1 4%h i g h e r t h a n t h a t o f M o b i l e N e t V 2 r e s p e c t i v e l y,a n d t h e
10、 n u m b e r o f p a r a m e t e r s a r e d e c r e a s e d b y 8 2.2 8%.E x p e r i m e n t a l r e s u l t s v e r i f y t h e e f f e c t i v e n e s s o f t h e i m p r o v e d n e t w o r k m o d e l.K e y w o r d s:f a c i a l e x p r e s s i o n r e c o g n i t i o n;l i g h t w e i g h t n
11、e t w o r k;M o b i l e N e t V 2;i n v e r t e d r e s i d u a l b l o c k;c h a n n e l a t t e n t i o n*收稿日期:2 0 2 1-1 1-2 9;修回日期:2 0 2 2-0 5-0 5基金项目:国家自然科学基金(6 1 9 6 1 0 3 7);甘肃省教育厅2 0 2 1年度产业支撑计划(2 0 2 1 C Y Z C-3 0)通信地址:7 3 0 0 7 0 甘肃省兰州市西北师范大学物理与电子工程学院A d d r e s s:C o l l e g e o f P h y s
12、i c s a n d E l e c t r o n i c E n g i n e e r i n g,N o r t h w e s t N o r m a l U n i v e r s i t y,L a n z h o u 7 3 0 0 7 0,G a n s u,P.R.C h i n a C N 4 3-1 2 5 8/T PI S S N 1 0 0 7-1 3 0 X 计算机工程与科学C o m p u t e r E n g i n e e r i n g&S c i e n c e第4 5卷第6期2 0 2 3年6月 V o l.4 5,N o.6,J u n.2 0
13、 2 3 文章编号:1 0 0 7-1 3 0 X(2 0 2 3)0 6-1 0 7 1-0 81 引言人脸表情识别F E R(F a c i a l E x p r e s s i o n R e c o g-n i t i o n)1是指从给定的静态图像或者动态视频中提取出表情特征并加以判定的过程,从而确定识别对象的心理情绪。人脸表情识别作为人机交互的重要途径,是机器理解人类感情的前提。近年来,人脸表情识别技术在交通安全、抑郁症治疗和课堂质量检测等方向迅速发展。例如疲劳监测时根据驾驶员的面部表情变化判断其精神状态;抑郁症治疗时利用患者面部表情推测其心理变化;课堂中通过检测学生面部表情判断
14、教师课堂教学质量。在表情识别技术的实际应用中,由于传统的卷积神经网络C NN(C o n v o l u t i o n a l N e u r a l N e t w o r k)参数量大,对硬件设备要求高,存在应用场景受限问题。因此,对应用范围广泛的轻量级人脸表情识别网络进行研究具有重要意义。早在1 9 7 8年,S u w a等2开始尝试使用机器学习的方式在一段人脸表情的动态视频中进行最初的表情识别。1 9 9 6年,P a d g e t t等3使用主成分分析提取人脸图像中图像子块的主元,并利用前1 5个主元提取人脸图像特征,输入到具有非线性激活函数的神经网络中进行表情识别。2 0 0
15、 2年,F a-s e l4研究发现C NN对于位置变化和尺度变化具有鲁棒性,在人脸表情识别领域的性能优于多层感知机。在利用卷积神经网络进行表情识别时,先通过网络模型中的特征提取层对人脸面部表情特征进行提取,然后神经网络对具有判别性的表情特征进行学习训练,最后分类器依据学习到的表情特征对面部表情进行分类,从而形成一个端到端的识别分类过程。卷积神经网络在人脸表情识别领域中发展迅速,已成为该领域主要研究方法之一,但在实际应用中,由于受硬件设备的影响,存在内存不足、延迟高等问题。网络模型需要轻量化以满足现实场景的要求。研究人员通过设计轻量化网络5、模型剪枝和知识蒸馏等方式不断对网络模型参数量进行压缩
16、,降低其对空间和计算能力的要求,并将其应用在人脸表情识别的各类场景中。N g u y e n等6为了平衡面部表情分类问题的速度和准确性,采用S E-b l o c k与S q u e e z e N e t组合的模型,对人脸表情进行识别。F a t i m a等7通过C NN与X c e p-t i o n网络结合的方式,在确保整体模型准确率的基础上,使得模型参数量少于传统卷积神经网络的参数量。D o n g等8提出一种基于P C D-C NN(P o s e C o n d i t i o n e d D e n d r i t i c C NN)网络的表情识别模型,利用P C D-C NN
17、对人脸图像进行处理,有效地提取人脸表情特征信息。为了加速模型的训练速度,P C D-C NN基于S h u f f l e N e t-v 2框架,在参数量较小的情况下保持了较好的性能。上述表情识别网络模型主要存在以下几个问题:(1)表情特征在特征提取层中传输时存在特征丢失现象,使得网络模型表情分类准确率受到影响;(2)对于一些要求苛刻的边缘设备,上述网络模型结构过于复杂且参数量较大,网络模型无法兼顾较小的参数量与较好的准确率,使得其在实时性要求较高的应用场景中难以应用。为了解决上述问题,需要在准确率与参数量之间达到一个较好的平衡,这对表情识别模型提出了极高的要求。基于此,本文网络模型选用M
18、o b i l e-N e t V 2网络。M o b i l e N e t9网络是谷歌公司为移动端和嵌入式设备设计的新型轻量化网络,其采用流线型架构,由倒残差模块堆叠出轻量级深度学习网络的基本框架,研究人员可针对人脸表情特点对网络模型进行有针对性的改进。网络采用深度可分离卷积大大减少了参数量,使得表情识别可在移动设备上进行。且宽度因子和分辨率因子2个超参数可以分别用于调整特征图的通道数和尺寸,使表情识别的应用场景更加广泛。本文网络模型在M o b i l e N e t V 2网络的基础上,从3个方面进行改进:(1)通过调整M o b i l e N e t V 2网络的宽度因子对网络通道
19、数进行压缩,在准确率下降的可接受范围内,减少网络总参数量;(2)对线性瓶颈层进行改进,引入S a n d G l a s s模块,减少特征信息在卷积层传输时的丢失情况;(3)添加轻量级高效注意力E C A(E f f i c i e n t C h a n n e l A t t e n t i o n)机制,在总参数量略有增加的情况下,增强网络模型对输入图像特征信息的提取能力。2 网络模型设计本文以搭建高准确率、低参数量的人脸表情识别模型为目的,选取M o b i l e N e t V 2为网络主干,通过调整宽度因子、引入S a n d G l a s s模块和E C A机制等方法进行改进
20、。本文以S a n d G l a s s模块为基础,重新搭建网络模型,结构如表1所示。表1中S a n d G l a s s模块为改进的线性瓶颈结构(详细改进内容见2.2节),N o.为网络模型各部分顺序,t为缩减系数,s为步长,n为重复次数,kb为输出表情的种类数,E C A为含有E C A机制的S a n d G l a s s模块。2701C o m p u t e r E n g i n e e r i n g&S c i e n c e 计算机工程与科学 2 0 2 3,4 5(6)T a b l e 1 O v e r a l l n e t w o r k s t r u c
21、 t u r e p r o p o s e d i n t h i s p a p e r表1 本文整体网络结构表N o.t输入维度sn输出维度结构E C A1-34 84 8 261 62 42 4c o n v 2 d 33-221 62 42 4222 41 21 2S a n d G l a s s B l o c k362 41 21 2133 266S a n d G l a s s B l o c k-463 266136 433S a n d G l a s s B l o c k566 433149 633S a n d G l a s s B l o c k-669 63
22、3121 6 022S a n d G l a s s B l o c k-761 6 022133 2 022S a n d G l a s s B l o c k8-3 2 022113 2 011a v g p o o l 22-9-3 2 01111kbc o n v 2 d 11-将尺寸为34 84 8的图像输入到网络模型中。输入图像先经过33卷积核组成的卷积层,再经过由S a n d G l a s s模块堆叠而成的网络主体框架,然后通过全局平均池化层GA P(G l o b a l A v e r-a g e P o o l i n g),最后由一层全连接层来预测每个表情分类的最
23、终得分,得分最高的表情即为网络预测表情。特征图在卷积层经过卷积操作后由B a t c h N o r m a l i z a t i o n层进行归一化处理。2.1 宽度因子调整为了构 建 参 数 量 更 小 的 模 型,研 究 人 员 为M o b i l e N e t系列网络引入了一个超参数,称为宽度因子。宽度因子的作用是在网络模型中通过对每层通道进行一定比例的压缩,从而减少各层的通道数。在卷积层进行卷积时,调整后的参数量如式(1)所示:T=DKDK M NDFDF(1)其中,T为深度可分离卷积的参数量,DK为深度卷积核的边长,M为逐点卷积的通道数,DF为输入图像的边长,N为输入图像的通
24、道数。通过宽度因子可以将M o b i l e N e t V 2网络模型的参数量降低为原模型的1/2。在M o b i l e N e t中压缩宽度因子对网络模型准确率与参数量的影响如表2所示。表2中,At o p 1为M o b i l e N e t网络在I m a g e N e t数据集上的t o p1准确率,P为参数量。随着宽度因子减小,网络参数量与性能均出现不同程度的下降。T a b l e 2 M o b i l e N e t p e r f o r m a n c e u n d e r d i f f e r e n t w i d t h f a c t o r s表2
25、 不同宽度因子下的M o b i l e N e t性能表现模型At o p 1/%P/MBM o b i l e N e t(=1.0)7 0.64.2M o b i l e N e t(=0.7 5)6 8.42.6M o b i l e N e t(=0.5)6 3.71.3 鉴于减小宽度因子可以大幅减少网络模型参数量且网络精度的损失在可以控制的范围内。本文令=0.7 5并将网络最高输出维度降低至3 2 0,以减少特征维度在倒残差模块中频繁变化造成的参数量冗余,并通过其他改进措施提高网络准确率,从而使模型在轻量化的同时保持较好的准确率。2.2 残差模块随着网络模型的卷积层数不断增加,残差
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 改进 MobileNetV2 表情 识别 严春满
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。