深度人脸识别方法综述.pdf
《深度人脸识别方法综述.pdf》由会员分享,可在线阅读,更多相关《深度人脸识别方法综述.pdf(11页珍藏版)》请在咨信网上搜索。
1、Software Engineering and Applications 软件工程与应用软件工程与应用,2023,12(4),609-619 Published Online August 2023 in Hans.https:/www.hanspub.org/journal/sea https:/doi.org/10.12677/sea.2023.124059 文章引用文章引用:王海勇,潘海涛.深度人脸识别方法综述J.软件工程与应用,2023,12(4):609-619.DOI:10.12677/sea.2023.124059 深度人脸识别方法综述深度人脸识别方法综述 王海勇王海勇,潘海涛
2、潘海涛*南京邮电大学计算机学院,江苏 南京 收稿日期:2023年6月3日;录用日期:2023年8月9日;发布日期:2023年8月17日 摘摘 要要 深度人脸识别通过大规模数据集训练卷积神经网络获取更鲁棒的人脸表示深度人脸识别通过大规模数据集训练卷积神经网络获取更鲁棒的人脸表示,极大的提升了人脸识别性能。极大的提升了人脸识别性能。文中总结了深度人脸识别方法的发展脉络,首先根据卷积神经网络的不同发展阶段回顾了现有的深度人文中总结了深度人脸识别方法的发展脉络,首先根据卷积神经网络的不同发展阶段回顾了现有的深度人脸识别方法,其次对基于欧几里得距离以及基于角余弦裕度的损失函数进行了回顾,同时总结了一些针
3、脸识别方法,其次对基于欧几里得距离以及基于角余弦裕度的损失函数进行了回顾,同时总结了一些针对特定任务的人脸识别方法。然后总结了现有的人脸识别数据集以及人脸识别性能的评价指标,并对主对特定任务的人脸识别方法。然后总结了现有的人脸识别数据集以及人脸识别性能的评价指标,并对主流深度人脸识别方法进行了比较。最后总结了人脸识别当前面临的挑战和未来的发展趋势。流深度人脸识别方法进行了比较。最后总结了人脸识别当前面临的挑战和未来的发展趋势。关键词关键词 人脸识别人脸识别,卷积神经网络卷积神经网络,人脸表示人脸表示,损失函数损失函数 A Survey of Deep Face Recognition Haiy
4、ong Wang,Haitao Pan*College of Computer Science,Nanjing University of Posts and Telecommunications,Nanjing Jiangsu Received:Jun.3rd,2023;accepted:Aug.9th,2023;published:Aug.17th,2023 Abstract Deep face recognition greatly improves the performance of face recognition by training convolu-tional neural
5、 networks on large-scale data sets to obtain more robust face representation.This paper summarizes the development of depth face recognition methods.First,the existing depth face recognition methods are reviewed according to the different development stages of convolu-tional neural networks.Secondly
6、,the loss functions based on Euclidean distance and angular co-sine margin are reviewed,and some task-specific face recognition methods are summarized.Then,the existing data sets and the evaluation indicators of face recognition performance are summa-rized,and the mainstream depth face recognition m
7、ethods are compared.Finally,the current challenges and future trends of face recognition are summarized.*通讯作者。王海勇,潘海涛 DOI:10.12677/sea.2023.124059 610 软件工程与应用 Keywords Face Recognition,Convolutional Neural Networks,Face Representation,Loss Function Copyright 2023 by author(s)and Hans Publishers Inc.
8、This work is licensed under the Creative Commons Attribution International License(CC BY 4.0).http:/creativecommons.org/licenses/by/4.0/1.引言引言 人脸识别在计算机视觉和模式识别领域广受关注,具有很多现实应用,包括身份认证、访问控制、人机交互等。由于人工智能技术的兴起,人脸识别技术取得了重大进展,早期研究兴趣主要集中在受控条件下的人脸识别。现如今的研究重点在于无约束条件下的人脸识别,传统的人脸识别方法无法提取鲁棒的人脸表示,面对光照、姿态变化等无约束场景下的
9、识别性能较差。基于深度学习的人脸识别方法克服了传统手工提取人脸特征的局限性,成为了目前的研究热点。人脸识别也可以看成是一个多分类任务,其将人脸图像投影到特征空间,要求不同身份的人脸特征分布尽可能分散,而相同身份的人脸特征分布尽可能紧凑,所提取的人脸特征必须具有较高的可分辨性,卷积神经网络强大的特征提取能力使其在图像分类、目标检测等计算机视觉领域广受关注,同时也推动了深度人脸识别技术的发展。深度人脸识别过程如图 1 所示,主要分为三个部分,包括人脸预处理、人脸表征和人脸匹配。人脸预处理主要包括人脸检测和人脸对齐,人脸检测是在一张图像中检测并截取出人脸区域,之后将人脸区域进行人脸对齐,即获取人脸关
10、键点并进行相似性变换,将人脸区域映射回标准人脸。人脸表征是将预处理完成后的人脸图像输入深度神经网络提取人脸特征,将每幅人脸图像映射为一维向量,最后进行人脸匹配,将代表两幅图像的人脸特征向量进行比对,使用欧几里得距离或余弦相似度进行度量,看是否属于同一身份。人脸识别可进一步分为一对一的人脸验证任务以及一对多的人脸辨认任务,人脸验证任务是将待测人脸与给定的人脸进行比对,看是否为同一身份,主要用于刷脸支付、手机解锁等场景。人脸辨认任务则是将待测人脸与给定的人脸图像库中的人脸进行比对,看是否属于图像库中的人脸身份,主要用于门禁系统、视频监控等场景。Figure 1.Process of deep fa
11、ce recognition 图图 1.深度人脸识别流程 近年来深度人脸识别的研究主要针对网络架构以及损失函数进行优化改进。网络架构主要基于现有的卷积神经网络进行改进,目的是使提取出的人脸特征对光照、姿态变化等因素具有鲁棒性,同时具备可区分性。为了更好的划分决策边界,使类内更聚,类间更开,提出了一系列用于人脸识别的损失函数,包括对比损失、三元组损失、中心损失以及基于角余弦裕度的损失。本文主要归纳总结了深度人脸识别Open AccessOpen Access王海勇,潘海涛 DOI:10.12677/sea.2023.124059 611 软件工程与应用 技术,总结了基于不同网络架构的人脸识别方法
12、,回顾了深度人脸识别中用于监督训练的损失函数,包括基于欧几里得距离的损失和基于角余弦余量的损失。接着总结了人脸识别常用的数据集和评价指标,并在数据集上对主流的深度人脸识别方法进行比较。最后总结了人脸识别目前面临的挑战和未来的发展趋势。2.网络模型网络模型 深度人脸识别主要采用卷积神经网络作为特征提取网络提取人脸特征,卷积神经网络的关键思想就是局部感受野、权值共享以及池化。目前深度人脸识别的网络模型可分为两类,一类是深度卷积神经网络,通过设计更复杂的网络模块提升网络的特征提取能力,但急剧增加的模型参数和计算量使其无法应用于实时人脸识别任务。另一类则是轻量级网络,设计轻量级架构降低模型参数量和计算
13、量,同时保持良好的识别性能,提升现实场景的应用能力。本文将重点关注基于卷积神经网络的深度人脸识别方法,并依据不同的网络模型对深度人脸识别方法进行归纳总结。2.1.基于基于 AlexNet 的人脸识别方法的人脸识别方法 自 AlexNet 被提出并在 ImageNet 分类竞赛中获得第一,卷积神经网络受到计算机视觉领域的关注。AlexNet 分别在两个 GPU 上进行同等操作,每个卷积层都包含卷积、池化和激活,使用 ReLu 激活函数替代 Sigmoid 并引入 dropout 策略使神经元随机失活,保持网络的稀疏性,防止过拟合。受 AlexNet模型的启发,Deepface 被提出,首次使用卷
14、积神经网络提取人脸特征,使用 9 层 CNN 结构提升了人脸验证性能。DeepID2 通过 4 层卷积加池化操作提取人脸特征。这些深度人脸识别方法借助卷积神经网络极大的提升了人脸识别性能,使得基于深度学习的人脸识别方逐渐取代了传统基于图像处理的人脸识别方法。2.2.基于基于 VGGNet 的人脸识别方法的人脸识别方法 AlexNet 网络深度有限,一个自然的想法就是增大网络深度,进一步提取图像的高维特征,于是VGGNet 被提出,其将卷积核大小减小为 3 3 以减少参数量,虽然卷积核大小减少会导致小的感受野,但通过堆叠多个 3 3 卷积可以获得相当于 5 5 或 7 7 的感受野,更多的非线性
15、映射可以增加网络的拟合能力。为进一步提取高层的人脸特征,为了使网络更好的学习中间层特征,使深层网络更容易优化,Yi Sun 等人将 VGGNet 最后几层的卷积改为局部卷积,将全局权值共享改为局部区域权值共享,同时在多个中间卷积层分支出的全连接层中添加监督信号。虽然通过增加网络深度可以一定程度的提升网络的特征提取能力,但也会使参数量和计算量的大幅增加,同时也会增大过拟合的风险。2.3.基于基于 GoogleNet 的人脸识别方法的人脸识别方法 Figure 2.Example of inception structure 图图 2.Inception 结构示例 王海勇,潘海涛 DOI:10.1
16、2677/sea.2023.124059 612 软件工程与应用 GoogleNet 通过设计一种 Inception 模块化结构来保持神经网络的稀疏性,使用稀疏连接代替全连接和卷积,缓解了过拟合和计算复杂度过高的问题,Inception 结构如图 2 所示,在同一层中同时部署多个卷积和池化操作,将每个经过卷积和池化后的特征图进行通道拼接。每个 Inception 结构中包含不同大小的卷积尺寸,图 2 仅给出一种常用的卷积尺寸。受 GoogleNet 启发,Hana Ben Fredj 等人分别在第 2、3、4 个池化层之后加入 2、5、2 个 Inception 结构,同时还使用了一些数据增
17、强技术,在 LFW 和 YTF 数据集上提升了人脸识别性能。Inception 的结构相比于堆叠卷积的方式减少了参数和计算量,同时多尺度卷积的方式有利于提取人脸图像的多尺度特征,进而提升人脸识别性能,但随着 Inception 模块的增多,梯度消失或梯度爆炸的问题仍然存在。2.4.基于基于 ResNet 的人脸识别方法的人脸识别方法 在之前的深层网络优化过程中,若每一层的误差梯度小于 1,反向传播时网络越深梯度越趋近于 0,导致梯度消失,若每一层的误差梯度大于 1,反向传播时网络越深梯度越大,导致梯度爆炸。ResNet 提出一种残差连接方法,缓解了网络过深导致的性能退化问题,其中提出的残差模块
18、结构如图 3 所示,其在多个权重层之后添加快捷连接方式,将经过多层特征提取之后的特征 F(x)与原始特征 x 对应相加,保证在经过多层特征提取之后原始特征信息不会丢失。因此近年来主流的深度人脸识别方法多采用残差连接的网络结构,实现了最先进的人脸识别性能。该残差连接方式不受模块内具体结构的影响,所以可以很好的兼容其他网络模型。Figure 3.Structure of residual module 图图 3.残差模块结构 2.5.基于轻量级网络的人脸识别方法基于轻量级网络的人脸识别方法 深度卷积神经网络通过堆叠卷积和池化操作提取图像的深层特征,一方面可以提升网络的特征提取能力,但另一方面也带来
19、了较大的资源消耗,大量的参数和复杂的计算量使其在移动端的应用受到限制。轻量级网络模型的提出显著降低了卷积神经网络的参数量和计算量。受这些轻量级模型启发,一些基于轻量级网络的人脸识别方法被提出,使得实际应用可以在移动端部署人脸识别系统。为了降低计算复杂度,MobileFaceNet 1使用深度可分离卷积替代普通卷积,同时使用全局深度卷积替代全局平均池化,突出人脸图像中心单元的特征。为进一步提升 MobileFaceNet 的速度,Mobiface 2使用快速下采样,在提取特征的最开始阶段连续地应用下采样步骤,以避免特征图的大空间维度。然后在后期添加更多的特征图,以支撑整个网络的信息流。Shuff
20、leFaceNet 通过使用全局深度卷积层和参数校正线性单元(PReLU)来王海勇,潘海涛 DOI:10.12677/sea.2023.124059 613 软件工程与应用 扩展 ShuffleNetV2,用于实时人脸识别应用。Jintao Zhang 等3使用 Seesaw 模块,用非均匀的组卷积替代逐点卷积并添加通道混洗操作实现不同卷积组之间的信息流动。Fadi Boutros 等4使用混合卷积,对输入通道进行分组并将不同的内核大小应用于每个组,并结合通道混洗操作。这些人脸识别方法通过设计轻量级的网络架构或高效的卷积方式极大的减少了模型的复杂度,提升了人脸特征提取效率,促进了深度人脸识别在
21、移动端的应用。3.损失函数损失函数 人脸识别损失函数的设计对于网络模型的监督训练起到关键作用,其将人脸特征映射到特征空间进行相似性比较,根据特征空间的不同可分为基于欧几里得距离的损失函数与基于角余弦裕度的损失函数。基于欧几里得距离的损失函数将人脸特征映射到欧几里得空间,通过比较人脸特征之间的欧几里得距离判断人脸身份。基于角余弦裕度的损失函数则将人脸特征映射到超球空间,再使用人脸特征之间的余弦相似度判断人脸身份。3.1.基于欧几里得距离的损失函数基于欧几里得距离的损失函数 对比损失向网络输入两种类型的样本对,即正样本对(来自同类的两张脸)和负样本对(两张来自不同类的人脸图像),最小化正样本对的欧
22、几里德距离,并惩罚距离小于阈值的负样本对。假设有一对人脸特征,DW表示两个人脸特征的欧氏距离,Y 为两个特征是否匹配的标签,当两个特征匹配时取 1,否则取0,m 为设定的距离阈值,N 为样本数量,则对比损失如式 1 所示。对比损失引入两种监督信号,其中识别信号使用交叉熵损失,使不同人脸身份的特征之间有足够的间距,而验证信号采用对比损失,最小化相同身份人脸特征对的欧氏距离。()()22111max,0NWWnLYDYmDN=+(1)FaceNet 尝试使用三元组损失代替 SoftMax 损失来监督训练网络模型,与对比损失不同的是,三元组损失将每张人脸图像与其他人脸图像构成的每个图像对之间设置边距
23、,而对比损失试图将一个身份的所有人脸投射到嵌入空间的单个点上。三元组损失使用三元组(xa,xp,xn)作为输入,其中 xa表示锚点,即能代表类中心的样本,xp表示正类样本,与 xa属于同一人脸身份,xn表示负类样本,与 xa属于不同人脸身份。在训练时我们选择三元组使其满足式 3 表示的不等式,函数 f 表示特征提取过程,为距离阈值,若违背式 2 则更新网络参数,只有不满足式 2 的三元组才会对网络参数更新起到积极作用。该损失函数的目的是在训练过程中将正样本对距离拉近,负样本对推开。三元组损失的提出有效的提升了人脸识别性能,但在每个训练批次中选择硬三元组的方式,增加了训练难度。()()()()2
24、222apanf xf xf xf x+(2)由于对比损失和三元组损失训练难度较大,会出现训练不稳定的情况,中心损失被提出,该损失通过限制类内样本与其类中心的距离使同类样本之间的距离更近,其损失公式如式 3 所示,cyi代表属于第yi类人脸的类中心,在每轮迭代的小批次中选择与类中心同属一个类别的人脸特征更新 cyi。由式 3 可以看出该损失只能将相同身份的人脸特征距离拉近,无法保证不同身份的人脸特征之间的距离,所以该损失需要配合 Softmax 交叉熵损失一起训练。中心损失避免了挖掘硬样本,简化训练步骤,但该损失要求各个身份的人脸图像足够多且平衡,保证每个类中心都被充分优化。22112imCi
25、yiLxc=(3)王海勇,潘海涛 DOI:10.12677/sea.2023.124059 614 软件工程与应用 3.2.基于角余弦裕度的损失函数基于角余弦裕度的损失函数 基于欧几里得距离的损失函数的本质是使同身份人脸特征更紧凑而不同身份人脸特征分布更分散,但基于欧式距离的度量方式使得网络模型训练过程复杂且不容易收敛。为了不增加额外的损失,SphereFace 5基于原始 Softmax 损失进行改进,提出了 A-Softmax Loss,将式 1 中的jjWx转换为,cosjjj jWx,,j j表示权值矩阵第 j 列的向量jW与特征向量jx之间的夹角,同时为了便于训练将jW归一化为 1,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 深度 识别 方法 综述
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。