改进模糊二值模式算法及其在卷积神经网络中的降噪性能_李芳慧.pdf
《改进模糊二值模式算法及其在卷积神经网络中的降噪性能_李芳慧.pdf》由会员分享,可在线阅读,更多相关《改进模糊二值模式算法及其在卷积神经网络中的降噪性能_李芳慧.pdf(4页珍藏版)》请在咨信网上搜索。
1、第 51 卷收稿日期:2022年8月10日,修回日期:2022年9月21日作者简介:李芳慧,女,硕士,研究方向:深度学习,图像处理。裴腾达,男,硕士,研究方向:物联网工程。1引言目前人脸识别技术已经在社会诸多领域上得到了广泛应用,为社会的安全以及经济发展带来了巨大的便利。传统的人脸识别技术主要以浅层结构模型为主,它们在处理图像、视频、语音等高维数据方面表现较差,特征提取难以满足需求,而深度学习技术弥补了这一缺陷1。深度学习采用深层神经网络模型,即具有特殊训练方式的包含多个隐藏层的神经网络2。1989年LeCun提出了真正意义上的适用于深度学习训练的算法卷积神经网络(Convolutional
2、Neural Networks,CNN)3。CNN因其具有独特的结构优势,在图像分类、图像检索、人脸识别等领域得到了广泛应用4。目前比较成功的CNN网络模型有AlexNet5、GoogleNet6、VGGNet7、ResNet8等。CNN网络对输入图像进行分类识别,然而在含有噪声干扰的环境下,采集到的图像质量差,使得网络的效果大幅度降低。在卷积神经网络中,池化层的重要作用是实现特征降维、提取关键信息并丢弃冗余信息。然而,传统的池化操作只是对数据进行简单的粗处理,如最大池化法只极端的保留最大值元素,很容易引进噪声;平均池化法取池化窗口内的均值,弱化了最大值关键元素。对此,国内外许多研究学者提出了
3、改进模糊二值模式算法及其在卷积神经网络中的降噪性能李芳慧裴腾达(大连大学信息工程学院大连116622)摘要针对传统池化方法未考虑不同像素点信息贡献存在差异的问题,论文设计了融合改进模糊二值模式的加权池化方法,该算法利用模糊隶属度函数计算出各像素点为等价模式的概率,并对应生成合适的权重值,在卷积神经网络的池化阶段,结合输入特征图及权重图,得到其加权池化输出值。利用ORL人脸数据库进行的实验结果表明,在测试图像含有噪声的情况下,论文提出的加权池化算法比传统最大池化法具有更好的降噪能力和人脸识别效果。关键词模糊二值模式;卷积神经网络;加权池化;降噪中图分类号TP301.6DOI:10.3969/j.
4、issn.1672-9722.2023.03.032Improved Fuzzy Binary Pattern Algorithm and Noise ReductionPerformance in Convolutional Neural NetworksLI FanghuiPEI Tengda(School of Information Engineering,Dalian University,Dalian116622)AbstractSince the traditional pooling method does not take into account the differenc
5、e in the importance of different pixels toexpress information,In this paper,a weighted pooling method with improved fuzzy binary mode is designed.This algorithm uses thefuzzy membership function to calculate each pixel.It is the probability of the equivalent model and correspondingly generates a sui
6、table weight value.In the pooling stage of the convolutional neural network,the input feature map and the weight map are combinedto obtain its weighted pooled output value.The experimental results on the ORL face database show that the weighted pooling algorithm proposed in this paper has better noi
7、se reduction ability and network recognition rate than the traditional maximum poolingmethod when the test image contains noise.Key Wordsfuzzy binary model,convolutional neural network,weighted pooling,noise reductionClass NumberTP301.6总第 401 期2023 年第 3 期计算机与数字工程Computer&Digital EngineeringVol.51 No
8、.37122023 年第 3 期计算机与数字工程较为有效的改进方法。2013年Rob Fergus 等9提出了随机池化(Stochastic pooling)方法,在池化窗口内对特征图数值进行归一化,按照特征图归一化后的概率值大小随机采样选择。2018年Wei等10提出了局部加权平均池化方法,通过给池化元素添加可学习的权重来实现更有效的特征提取。本文算法考虑了图像像素点的噪声影响,提出了融合改进模糊二值模式的加权池化方法,减少干扰信息逐层累积传递。2融合改进模糊二值模式的加权池化算法2.1自适应中值的改进模糊二值模式近年来,局部二值模式(Local Binary Pattern,LBP)11的
9、特征提取算法在人脸识别的应用中取得了显著的成果,但仍存在对光照变化较敏感,以及对含噪声纹理图像特征表述能力不足等问题12。为增强 LBP 算法对图像干扰的稳定性,Iakovidis等13引入数学中的模糊逻辑理论,提出了模糊局部二值模式(Fuzzy Local Binary Pattern,FLBP)算法,并在超声图像实验中获得了不错的分类效果。FLBP的算法过程为:取33窗口内的8个邻域像素值依次与中心像素值作差,若差值大于某特定阈值,则编码为0或1,否则将该点编码为不确定位u,其公式表达为b()zp=|1zptpu|zptp0zp-tp(1)其中tp是一个预定义的阈值,Zp是邻域像素与中心像
10、素的灰度差,u代表不确定位。对于不确定位,编码为 0或 1的概率可利用隶属度模糊函数来确定,计算公式如下:p()u=1=0.5+0.5zptp(2)p()u=0=1-p()u=1(3)p(u=1)表示编码为1的概率,p(u=1)表示编码为0 的概率。统计编码值即可得出图像的局部特征。FLBP虽然能够在一定程度上提高算法的抗噪性能,但如果中心像素点为噪声点,则以该点为基准的编码计算将失去其意义。因此本文借鉴自适应中值滤波14的思想,提出了自适应中值的改进FLBP算法,根据干扰噪声的灰度值通常常远大于或远小于邻域像素值的特性先判断中心像素点是否为噪声点,若是则用中值替换,然后再进行编码以提高算法抗
11、噪性。过程如图1所示。9280818815087979982LBP编码:0000000080 81 82 87 88 92 97 99 150自适应中值928081888887979982LBP编码:11110000图1自适应中值的改进FLBP算法示意图左图为原像素分布,右图为改进后的像素分布。从编码结果中可以看出,经改进FLBP算法计算出的编码更丰富,具有更强的图像特征描述能力,并能有效的剔除突发噪声点,提高算法抗噪性。2.2加权池化方法为降低特征维度,Ojala 等将编码结果简化为等价模式和非等价模式,其中等价模式的数量达到90%以上,能够代表大部分信息,可以视为图像的关键特征15。在正常
12、的人脸图像中,等价模式出现的频率远高于非等价模式,且这些小部分出现的非等价模式通常是由噪音导致的。因此本文算法基于等价模式理论,取该像素点属于等价模式的概率和为权重值,该权重反应了像素点信息的重要程度,计算过程如图2所示。9280818890879799821 u1110u20010110000101101001111010011110000100u1u2110非等价模式等价模式 P=0.24图2权重计算在编码的循环二进制值串中,0-1或1-0的跳变次数小于2的编码结果都属于等价模式。如图中 11110000 的变化次数为 2 次,所以属于等价模式。根 据 式(2)和 式(3),可 以 计 算
13、 出 编 码 为11110000 的概率值为 p(u1=1,u2=0)=0.30.8=0.24,即该点的权重为0.24。池化层是深度学习中一个较为重要的概念。本文提出的加权池化方法依据各像素点信息大小的差异,赋予其不同的权重值,并对输入特征图进行加权池化操作。加权池化过程如图3所示。10.30加权求和010.71000.250.07500.250000.250.175池化输入生成权值重新分配池化输出图3加权池化过程1)取图像的33窗口,利用改进的FLBP算法进行编码计算,得到中心像素点对应的权值;2)重复步骤1),可生成一张与原图对应的权重图;3)取713第 51 卷权重图33窗口内的值,按比
14、例重新分配,确保其值总和为1;4)将原像素值与权值进行加权求和,得出池化输出结果;5)以步长为2的重叠池化窗口遍历整个输入图像,可最终得出池化输出结果。3实验设计与仿真结果分析本文使用的实验平台为CPU,Windows10操作系统,平台搭载的测试软件为 Matlab R2018a。本文选取ORL数据库进行人脸图像可视化测试,该数据库包含40人,每人含有10张不同姿态、角度和表情的人脸照片。为防止网络过拟合,增加数据多样性,在实验使用人脸图像前,进行了一定的数据增强以扩充数据集。图4直观地比较了LBP算法和本文所提加权FLBP算法的特征提取效果图。图4第一行为正常人脸图像,第二行为LBP特征提取
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 改进 模糊 模式 算法 及其 卷积 神经网络 中的 性能 李芳慧
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。