基于遗传算法和集成剪枝的表情识别方法.pdf
《基于遗传算法和集成剪枝的表情识别方法.pdf》由会员分享,可在线阅读,更多相关《基于遗传算法和集成剪枝的表情识别方法.pdf(9页珍藏版)》请在咨信网上搜索。
1、第36卷第5期2023年10月Vol.36 No.5Oct.2023四川轻化工大学学报(自然科学版)Journal of Sichuan University of Science&Engineering(Natural Science Edition)基于遗传算法和集成剪枝的表情识别方法唐玉梅,李丹杨,何 庆(贵州大学大数据与信息工程学院,贵阳 550025)摘 要:人脸表情识别在疲劳驾驶监测等场景有着广泛的运用。针对人脸表情识别难度大、单一分类器泛化能力较弱的缺点,基于集成学习理论,提出一种基于遗传算法和集成剪枝的表情识别方法。首先,更改卷积神经网络参数生成若干分类器,构建基分类器池;其次
2、,使用遗传算法选出基分类器池中准确率高、多样性好的分类器;最后,将选出的分类器按准确率降序排序,并依次加入集成系统进行大多数投票法集成,直到达到最高的识别准确率。与多个集成剪枝算法对比,在5个经典人脸表情数据库上的结果表明,该表情识别方法所选的基分类器规模更小,系统识别率更高。关键词:遗传算法;集成剪枝;表情识别;卷积神经网络中图分类号:TP181 文献标志码:A引 言面部表情识别是模式识别与人工智能领域的研究热点,在医疗1、教育2等领域有着广泛的应用。尽管已有学者对表情识别技术展开一系列的研究,但由于年龄、性别等综合因素的影响,要达到较高的表情识别率仍然富有挑战性3-4。深度学习能有效提升表
3、情识别效果,Li等5提出了一种注意力机制的卷积神经网络模型识别表情;Ge等6提出一种基于深度学习的表情识别方法。但是,这些方法均采用单个分类器进行分类预测,对未知数据的预测能力有限。集成学习通过组合若干分类器,提高模型的泛化能力7-8,可有效弥补单一模型在表情识别领域的不足。然而,随着集成分类器数目的增多,一方面计算量和需要的存储空间急剧增大;另一方面出现较多冗余分类器,降低预测系统的识别效果。集成剪枝从基分类器池中选择部分多样性较好、预测准确率较高的分类器集成,在实现提高集成系统泛化能力和预测性能的同时,保证了模型预测的实时性9-10。基分类器的准确率与多样性是影响集成剪枝效果的两个重要因素
4、,但二者又处于矛盾关系。搜索平衡了准确率和多样性的最优子集有助于构建可靠性高的分类系统。使用元启发式算法选择分类器,能够在可接受的计算成本内尽可能搜寻最优解。Zhu等11提出了一种改进的离散人工鱼群收稿日期:2022-08-11基金项目:贵州省科技计划项目(黔科合平台人才20185781)通信作者:李丹杨(1991-),女,教授,博士,研究方向为机器学习、大数据与信息融合及选择性集成、表情识别,(E-mail)文章编号:20967543(2023)05006709DOI:10.11863/j.suse.2023.05.092023年10月四川轻化工大学学报(自然科学版)算法与边缘聚类最小化相结
5、合的集成剪枝方法;Peng等12提出一种针对复杂工程优化问题的选择性集成多策略萤火虫方法,设置了 3 种不同的搜索策略。上述方法收敛速度较慢,勘探和开发之间没有得到很好的平衡,容易陷入局部最优。遗传算法具有隐含并行性和全局搜索两大显著特征13,在机器学习、组合优化和图像处理等领域得到广泛的应用14-15。综上,本文提出一种基于遗传算法和集成剪枝的人脸表情识别方法。首先,使用卷积神经网络构建基分类器;其次,通过遗传算法剔除冗余分类器和弱分类器;最后,将剩余分类器按准确率降序排序,并依次逐个加入集成系统,进行大多数投票法集成,直到达到最高的表情识别率。和多种剪枝方法相比,本文提出的基于遗传算法和集
6、成剪枝的表情识别方法贡献如下:1)提出一种用于集成剪枝的混合初始化种群方法,该方法通过二进制编码和自然数编码分别生成等量的初始种群,既增加种群的多样性,也加快收敛速度。2)提出一种启发式信息引导的类似路径构造的初始化种群方法,该方法使用自然数编码,根据分类器之间的准确率和多样性关系引导初始化种群生成。3)使用自适应变异和交叉算子改进了遗传算法的遗传进化过程;构建了一种简单有效的适应度评估函数,以提高算法的收敛速度和精度,减少集成系统的分类器规模,提高表情识别的效果。1 基于遗传算法和集成剪枝的表情识别方法本文提出一种基于遗传算法和集成剪枝的表情方法,以有效提升人脸表情的识别效果。所提方法主要包
7、括3个部分:首先,使用卷积神经网络生成若干分类器,形成基分类器池;其次,使用遗传算法对分类器池中的分类器进行选择,得到最优分类器子集,并按照准确率降序排序;最后,选择前n个准确率最高的分类器子集进行大多数投票法集成,得到最终的决策结果。具体流程如图1所示。“二进制+自然数”编码“随机+启发式信息引导”方法生成初始种群基于互信息的适应度函数评估个体的适应度满足终止条件?复合选择算子选择参与交叉的父代个体动态自适应交叉操作动态自适应变异操作精英保留策略N产生新种群CNN拟合训练样本训练集验证集基分类器池构建训练验证找出最优个体最优个体对应的分类器子集降序排序前n个分类器进行大多数投票法集成Y测试集
8、图1 基于遗传算法和集成剪枝的表情识别方法流程图1.1 基分类器训练卷积神经网络(CNN)可以更好地展现图像的深层次信息,对大型图像处理表现十分出色。因此,本文选择卷积神经网络(图2)作为基分类器,拟合表情数据,进行基分类器池的构建。高兴生气恐惧难过输入层卷积层池化层全连接层 输出层特征学习图2 卷积神经网络模型1.2 基于遗传算法的分类器选择模型1.2.1“二进制+自然数”编码为了适应本文提出的初始化方法,使用混合编码的方式。由于自然数编码适用于次序的组合优化问题,二进制编码操作简单易行,基本的选择、交叉和变异等遗传操作易于实现,因此,初始化阶段使用自然数与二进制编码。自然数编码只用于种群初
9、始化阶段,给每个分类器分配一个编号,按编号确定分类器的组合顺序。后续的遗传操作均选择0、1二进制数值作为编码方案(见图3),染色体是一个位符68第36卷第5期唐玉梅,等:基于遗传算法和集成剪枝的表情识别方法串,长度等于基分类器池中分类器的总量,染色体上的基因值1代表对应编号的分类器被选择,其余分类器不参与最终的决策层集成,则图3中染色体表示共有8个分类器,其中第1、5、7个分类器被选择参与集成。10001010图3 染色体示例1.2.2“随机+启发式信息引导”的初始化种群方法进化算法中,初始种群通常是随机生成的,会导致种群陷入局部最优。本文通过两种方法生成初始种群:一种是随机初始化;另一种是启
10、发式信息引导的类似路径构造的初始化方法。两种方法结合,能够在保持种群多样性的同时,加快遗传算法的收敛速度。设G=C,E为一个有向全连通图,其中C=()c1,c2,cD为D个基分类器组成的集合,表示图的节点,E=(ci,cj):ci,cj C表示图的边,边的权重计算方法为:S()ci,cj=Acc()ci MI()ci;L()1/d()ci,cj3(1)其中,Acc()ci为分类器ci的预测准确率;d()ci,cj为两个分类器之间的相似性,使用汉明距离作为度量准则,如式(2)所示;MI()ci;L为分类器与实际预测标签之间的相关性,如式(3)所示。d()ci,cj=p=1|cj|cipcjp|c
11、j(2)其中,为布尔运算中的逻辑“或”运算,|为基底。设有n个验证样本,则分类器c可以表示为 c=(pre1,pre2,pren),prei表示分类器c对第i个样本的预测结果;L=(l1,l2,ln)表示样本的实际标签向量,lj表示第j个样本的实际标签,则分类器c与实际标签L之间的相关性为:MI()c;L=preicljLp()prei,ljlogp()prei,ljp()preip()lj(3)其中,p()prei,lj为联合概率分布,p()prei和p()lj分别为c和L的边缘概率分布。相关性值越大,表示分类器预测结果越可靠。启发式信息引导的类似路径构造的初始化种群方法步骤如下:1)使用自
12、然数编码方式给每个分类器分配一个编号,将分类器之间的关系视为无向全连通图,根据式(1)初始化各条边的信息强度及各分类器的禁忌表;2)随机生成所有分类器的初始排序,并取前m个分类器作为m条路径的起点,按步骤3)构造m条不同路径;3)分别在禁忌表的制约下,遍历剩余未选择的分类器,根据式(1)计算各条边的权重,选择与当前分类器权重最小的顶点作为下一个分类器,直到所有分类器都被选择,即按照分类器选择顺序形成m条完整路径;4)分别选择各条路径的前n个集成准确率最高的分类器,并将对应编号位置的值设为1,得到选择分类器的二进制编码。D=8(即分类器池中包含 8个基分类器)时的集成剪枝初始化方法示例如图4所示
13、。315674284276135871642835110011100011001010010110染色体1染色体2染色体m自然数编码构造m条完整路径自然数编码转为二进制编码染色体1染色体2染色体m选择各染色体集成准确率最高的前n个分类器图4 8个分类器的启发式信息引导的初始化种群示例692023年10月四川轻化工大学学报(自然科学版)图4中每条染色体代表一组分类器选择方案,染色体1表示选择前5个分类器集成能够使系统达到最高识别率,对应的分类器编号分别为3、5、1、6、7,转化为二进制编码时,将染色体第3、5、1、6、7号基因值设为1,其余基因值为0。1.2.3 基于互信息的适应度函数互信息通常
14、被用于衡量任意两个随机变量之间的相关性和统计依赖性,因此,本文使用一种简单有效的适应度函数实现分类器的选择,使得所选择的分类器与实际标签之间的平均相关性较大,且选择的分类器数量较少的染色体具有更高的适应度,如式(4)所示:fit()C=corravg-num()C(4)其中,、为平均相关性和选择分类器数量之间的权重因子,C=()c1,c2,cD()ci0,1,1 i D为D个分类器集合的一组选择方案,0,1为逻辑值,ci=1表示分类器ci被选择,num(C)表示选择的分类器数量,corravg表示选择的分类器子集与实际标签的平均相关性:corravg=i=1DMI()ci;L/num()C s
15、.t.ci=1(5)分类器c可以用该分类器在n个验证样本上的预测结果向量表示,即c=(pre1,pre2,pren),L=(l1,l2,ln)表示n个验证样本的实际标签向量,则分类器c与实际标签L之间的互信息为:MI()c;L=H()L-H()L|c(6)其中,H(L)为熵,表示L的不确定测度,可表示为:H()L=-liLp()lilogp()li(7)H(L|c)为条件熵,表示在c已知时,L的不确定测度,可表示为:H()L|c=-liLprejcp()li,prejlogp()li|prej(8)综合式(6)(8)可得最终分类器与实际标签之间的互信息计算公式为:MI()c;L=preiclj
16、Lp()prei,ljlogp()prei,ljp()preip()lj=preicljLp()prei,ljlogp()prei|ljp()prei(9)1.2.4 精英策略下的复合选择算子轮盘赌轮选择策略具有简单、易操作、收敛速度快等优点。但是,当问题规模较大时,可能会出现最优解和次优解差异较大的现象,导致算法陷入早熟。本文使用混合轮盘赌轮和锦标赛选择算子,通过两种算子各选择一部分个体进入下一代,增加搜索的广度,一定程度保证适应度值较高的染色体被选择的机会更大,同时,有助于提高收敛速度。最后,选择精英保留策略,保留每一代种群中的最优个体,保证算法的全局收敛。1.2.5 动态自适应交叉和变异
17、概率算法收敛速度使用动态自适应交叉概率pc和变异概率pm进行调整:当适应度值大于平均适应度时,减小pc增大pm,保持种群多样性,避免出现“早熟”;反之,则提高交叉概率,减小变异概率,提高算法的收敛速度。根据适应度值动态自适应调整交叉和变异概率,使得种群中优秀的个体不被破坏,又有利于新个体的生成,较大程度提高遗传算法的性能。设fmax为当前种群最大适应度值,f为待交叉个体中较大的适应度值,f为待变异个体的适应度值,favr为种群的平均适应度值,则交叉概率为:pc=0.95()fmax-ffmax-favr,f favr0.95,else(10)变异概率为:pm=0.5()fmax-ffmax-f
18、avr,f favr0.5,else(11)1.3 分类器集成使用大多数投票法将选出的分类器融合作为最终的预测类别mv(x)。输入测试样本x,大多数投票如式(12)所示:70第36卷第5期唐玉梅,等:基于遗传算法和集成剪枝的表情识别方法mv(x)=argmaxlLi=1mI(ci(x)=l)(12)其中,I()表示判别公式,L表示所有样本类别,ci(x)表示第i个分类器对测试样本x的预测标签。1.4 基于遗传算法和集成剪枝的表情识别算法流程1)输入表情图片,使用CNN拟合训练集,构建基分类器池;2)分别使用随机初始化和启发式信息引导的初始化方法生成等量的染色体,组合得到初始种群;3)使用式(9
19、)基于互信息的适应度函数评估个体的适应度,并找出适应度最高的个体;4)判断是否达到遗传算法终止条件,是则执行步骤9)步骤11),否则执行步骤5)步骤8);5)通过轮盘赌盘和锦标赛复合选择算子选择参与交叉和变异的父代个体,直到达到原始种群的数量;6)动态自适应交叉概率进行交叉操作;7)动态自适应变异概率进行变异操作;8)将步骤 3)中找出的最优个体随机插入完成变异的种群,产生新种群;9)输出最优个体;10)将最优个体选择的分类器按准确率降序排序;11)按照集成效果进行二次剪枝,依次增加分类器并使用式(12)进行大多数投票法集成,直至达到最优表情识别效果。2 实验与分析2.1 实验准备2.1.1
20、数据集实验选择 FER201316、JAFFE17、CK+18、RaFD19与KDEF20 5个经典的人脸表情数据集,并在所提出的基于遗传算法的集成剪枝框架上进行表情识别。各数据集部分表情示例如图5所示。生气厌恶恐惧高兴难过惊讶平静FER2013JAFFECK+RaFDKDEF图5 各数据集表情示例实验过程将所有表情统一成大小为48 48的单通道图,并将数据集划分为训练集、测试集和验证集3个部分。FER2013训练集数据量较大,用作训练集训练分类器,获得模型参数;公共验证集用作验证集,验证分类器效果,进行模型参数微调;测试集包括FER2013中的私有验证集(简记为FER)、CK+、JAFFE、
21、RaFD 与 KDEF,用于测试整个识别系统的性能。2.1.2 评价指标准确率(Accuracy,Acc)常作为衡量分类效果的标准。设TP和FP分别表示被正确分类和被错误分类的样本数量,Total表示总的样本数量,则Acc计算如式(13)所示:Acc=TPTP+FP=TPTotal(13)2.1.3 训练细节实验基于 Tensorflow 框架,主要通过调整超参数、网络结构,共生成231个CNN分类器形成分类器池。所更改的神经网络参数类型及范围见表1。表1 卷积神经网络参数设置参数类型网络层数卷积核池化层核池化步幅参数范围394,48,82,25,52参数类型学习率激活函数特征图数量边缘填充参
22、数范围0.01,0.03,0.05Relu,leaky_relu,Sigmoid16,32,48,64,80,90SAME,VALID生成的分类器对不同数据集的预测结果的箱线叠加散点图如图6所示,清晰地展现了基分类器对不同数据集预测准确率的分布情况。箱线图由上至712023年10月四川轻化工大学学报(自然科学版)下各横线依次表示基分类器预测准确率的最大值、上四分位数、中位数、下四分位数和最小值。箱线图中处于最大值和最小值之外的数据视为异常值,说明该分类器预测效果不具有代表性。总体上,在各个数据集上的识别准确率较为分散,说明基分类器池具有较好的多样性。图6 基分类器对不同数据集预测结果的箱线叠加
23、散点图2.2 实验结果与分析实验设置最大迭代次数为 300,锦标赛竞赛规模为5,平均相关性和选择分类器数量之间的权重因子、分别设置为0.9、0.1。在各个数据集上,对比不同种群规模pop对实验效果的影响,在各个数据集上的效果如图7所示。分类器池中共有231个基分类器,通过遗传算法剪枝后,选出的分类器数量减少一半,再根据准确率进行二次剪枝,近一步缩小集成分类器的规模。图7中,Baseline为基线,表示所有分类器集成的效果,总体上,剪枝后的分类器集成效果优于将所有分类器集成。由于二次剪枝按照准确率降序排序,剪枝后系统的识别性能远远好于选出的效果最优的分类器。随着分类器数量的不断增加,各个数据集上
24、识别准确率呈波动中上升又下降的趋势,这是因为不断增加分类器,后续分类器的识别效果较低,反而会降低整体的集成效果。相同条件下,各个数据集上不同种群规模的对比效果没有明显区别,说明不断增加种群规模不能从根本上找到最优解。(a)CK+(b)FER2013(c)JAFFE(d)KDEF72第36卷第5期唐玉梅,等:基于遗传算法和集成剪枝的表情识别方法(e)RaFD图7 不同种群规模下各个数据集上的集成剪枝效果2.3 与其他方法比较为了进一步验证所提方法的有效性,将本文方法与多个集成剪枝方法比较。表 2 为经过多次实验,在各个数据集上不同算法的最佳效果,其中,baseline 为基线,表示将分类器池中所
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 遗传 算法 集成 剪枝 表情 识别 方法
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。