宽型自注意力融合密集型残差网络的图像去雾.pdf
《宽型自注意力融合密集型残差网络的图像去雾.pdf》由会员分享,可在线阅读,更多相关《宽型自注意力融合密集型残差网络的图像去雾.pdf(10页珍藏版)》请在咨信网上搜索。
1、当前去雾算法无法很好解决不均匀雾霾图像去雾的问题,为此提出了一种宽型自注意力融合的条件生成对抗网络图像去雾算法.在算法中加入了宽型自注意力机制,使得算法可以为不同雾度区域特征自动分配不同权重;算法特征提取部分采用DenseNet融合自注意力网络架构,DenseNet网络在保证网络中层与层之间最大程度的信息传输的前提下,直接将所有层连接起来,获取更多的上下文信息,更有效利用提取的特征;融合自注意力可以从编码器部分提取的特征中学习复杂的非线性,提高网络准确估计不同雾度的能力.算法采用Patch判别器,增强去雾图像的局部和全局一致性.实验结果证明,算法网络在NTIRE 2020、NTIRE 2021
2、和O-Haze数据集上的定性比较,相比于其他先进算法得到更好的视觉效果;定量比较中,相较于所选择先进算法的最好成绩,峰值信噪比和结构相似性指数分别提高了0.4和0.02.关键词:图像去噪;图像去雾;生成对抗网络;宽型自注意力机制;马尔科夫判别器中图分类号:TP394.1 文献标志码:A Wide Self-attention Mechanism Fusion Dense Residual Network Image DehazingWU Kaijun,DING Yuan(School of Electronic and Information Engineering,Lanzhou Jiaot
3、ong University,Lanzhou 730073,China)Abstract:The current defogging algorithm cannot solve the problem of uneven haze image defogging,so this paper proposes a wide self-attention fusion conditional generation against network image defogging algorithm.The wide self-attention mechanism is added to the
4、algorithm,so that the algorithm can automatically assign different weights to the features of different haze regions.The feature extraction part of the algorithm adopts the DenseNet fusion self-attention network architecture.Under the premise of ensuring the maximum information transmission between
5、the middle layers of the network,the DenseNet network directly connects all layers to obtain more context information and make more effective use of the extracted features.Fusion of self-attention can learn complex nonlinearity from the features extracted from the encoder part,and improve the abilit
6、y of the network to accurately estimate different haze.The algorithm uses Patch discriminator to enhance local and global consistency of defogging images.The experimental results show that the qualitative comparison of the algorithm network on NTIRE 2020,收稿日期:2022-12-31基金项目:国家自然科学基金资助项目(61966022),Na
7、tional Natural Science Foundation of China(61966022);甘肃省自然科学基金资助项 目(21JR7RA300),Natural Science Foundation of Gansu Province(21JR7RA300);甘 肃 省 敦 煌 文 物 保 护 研 究 中 心 开 放 课 题(GDW2021YB15),Open Project of Dunhuang Cultural Relics Protection Research Center in Gansu Province(GDW2021YB15)作者简介:邬开俊(1978),男,山
8、东莒南人,兰州交通大学教授,博士,博士生导师 通信联系人,E-mail:文章编号:1674-2974(2023)08-0013-10DOI:10.16339/ki.hdxbzkb.2023283湖南大学学报(自然科学版)2023 年NTIRE 2021 and O-Haze datasets has better visual effects than other advanced algorithms.In the quantitative comparison,compared with the best performance of the selected advanced algor
9、ithms,the peak signal-to-noise ratio and the structural similarity index increases by 0.4 and 0.02,respectively.Key words:image denoising;image dehazing;generating adversarial network;wide self-attention mechanism;Patch discriminator进入 21 世纪以来,随着社会工业化的不断发展,空气的污染也越发严重,大气中雾霾的出现频率也更加频繁.当今社会汽车尾气以及工业废气的过
10、度排放导致雾霾天气频发,雾霾天气中悬浮的大量气状物质以及微粒会对光产生吸收和散射,导致成像设备所获取到的图像存在发白发暗、对比度降低、细节丢失和颜色偏移等情况,不利于图像的识别以及应用,雾霾天气不仅会影响拍摄图片的观感,更会对以图像处理为主要工作的计算机视觉系统产生严重的影响.过去图像去雾方法主要有两种:基于图像增强的去雾技术和基于图像复原的去雾技术.基于图像增强的去雾算法,主要采用现有的图像增强方法,简单的方法包括对雾图中的细节进行对比度与饱和度的增强,去除图像的噪声.这种去雾方式对于图像大面积泛白以及雾霾较深的情况处理效果并不理想,不能从根本上达到去雾的效果.汪秦峰1在基于直方图均衡化和R
11、etinex的图像去雾方法中,针对Retinex算法在处理雾霾不均的图像时,图像的浓雾区域细节丢失的问题,提出了一种基于面积融合的分块Retinex算法,较好解决了图像浓雾区域细节丢失问题,同时避免了块效应.基于图像复原的方法主要通过物理模型,估计各种参数来修复雾图,反演求解清晰的图像.现在通过将机器学习加入算法中,对物理模型中的各种参数和先验知识进行更加科学的估计和参考来提高去雾的效果,其中具有较大影响力的算法是He等2提出的基于暗通道的图像去雾技术.之后改进暗通道的去雾技术不断出现,比如吴迪等3提出的基于暗通道的快速图像去雾方法研究,肖进胜等4提出的基于天空约束暗通道先验的图像去雾,以及杨
12、红等5提出的基于暗通道的遥感图像云检测算法.上述传统图像去雾算法,在修复雾霾图像的过程中存在很大的局限性,鲁棒性差.基于深度学习的去雾算法主要是在CNN流行并成熟之后开始出现的算法,对比传统的图像去雾算法可以通过学习得到图像不同尺度的特征.在早期基于深度学习的去雾算法研究中,主要是利用卷积神经网络对大气散射模型中的参数进行估计.如 Cai 等6提出的去雾模型DehazeNet,对有雾图像的透射率等参数利用卷积神经网络直接估计,从而获得无雾图像.后期Ren 等7提 出 了 基 于 多 尺 度 卷 积 神 经 网 络 的 去 雾 算 法(MSCNN),可以通过获得不同尺度的特征,提高去雾后图像的精
13、度;Yu等8提出的基于PatchGAN的图像去雾算法,在判别器部分采用Patch判别器,可以通过对比图像中更大的感受野,提高整体一致性.近几年出现了几种比较先进的图像去雾方法,如Das等9提出了一种快速的深度多补丁分层网络,通过聚合来自雾霾图像不同空间部分的多个图像补丁的特征,使用更少的网络参数来恢复非均匀雾霾图像;Singh等10提出了一种新颖的生成对抗网络架构,即反向投影金字塔网络(BPPNet),结合了对多层次复杂性的学习,同时通过UNet的迭代块保留空间上下文,并通过新颖的金字塔卷积块保留多尺度的结构信息.雾霾图像在不同雾霾浓度情况下提取到的特征应该具有不同的权重,然而当前去雾算法无法
14、很好解决不均匀雾霾图像去雾的问题.综上,本文提出了一种宽型自注意力机制(Wide Self Attention,WSA)与DenseNet11网络结合的条件生成对抗网络(Conditional Generative Adversarial Networks,CGAN)12 图像去雾算法.文献 13 首次将SA引入GAN,极大提升了模型生成质量.本算法采用WSA可以有效对图像不同雾度的特征进行自动的权重分配,解决不同雾度特征的提取问题,更大的雾度区域给予更大的权重.DenseNet网络特点使得神经网络可以更深而不会使网络底部特征在高层消失,在不采用更多通道数的条件下获取到丰富的有雾图像上下文信息
15、,从而降低了模型的参数个数及复杂度.二者结合有效提升了网络的恢复能力,使得网络取得了良好的去雾效果.14第 8 期邬开俊等:宽型自注意力融合密集型残差网络的图像去雾1 本文模型本节介绍本算法的去雾端对端模型,即宽型自注意力融合DenseNet残差网络.总体架构基于生成式对抗网络,提出宽型自注意力机制并融合密集型神经网络实现去雾模型构建.1.1 网络总体结构网络总体结构主要由特征提取和 WSA融合的生成器和判别器组成.首先将输入的雾霾图像送入生成器的编码器和解码器中,利用多层卷积和WSA提取特征,生成去雾图像;之后将生成器生成的去雾图像和真实清晰样本图像送入判别器进行判别,然后将信息反馈到生成器
16、进行权重更新,通过生成器和判别器的对抗训练达到去雾的目的.下面探讨算法对于WSA的使用,加入WSA后模型性能的改变将在后面的消融实验中给出,整体结构如图1所示.1.2 宽型自注意力机制由于RGB空间R、G和B色之间存在高相关性,所以传统SA虽然可以极大提高生成图像质量,但是像素内部的高相关性会在学习中相互干扰,阻碍图像细节恢复;并且在特征学习中应考虑多尺度特征对结果产生的影响,进一步增强恢复效果.针对上述问题,在文献 14 基础上提出WSA降低这类影响,提高注意力特征图对总体特征和多尺度特征分析的影响,模块结构如图2所示,具体方法如下.1)由于R、G和B色之间存在高相关性,因此神经网络难以分割
17、变化较小的不同位置特征.而YCbCr 颜色空间在图像处理领域通常用于分割在RGB颜色空间中难以分离的对象,其原理是降低像素内部的高相关性.对于雾霾图像,不同雾度区域的特征在RGB空间难以分割,而在YCbCr颜色空间就可以更好分割不同区域,达到增强特征捕获能力的目的.采用YCbCr空间代替RGB空间,进一步增强图图1 网络总体结构图Fig.1 Network structure diagram图2 WSA结构图Fig.2 WSA structure diagram15湖南大学学报(自然科学版)2023 年像本身的细节恢复,具体方式为()YCbCr=()0.2570.5640.098-0.148-
18、0.2910.4390.439-0.368-0.071()RGB+()16128128(1)2)为了增强对雾霾图像不同雾度区域的特征捕获能力,在 SA 模块中加入 softmax 结构和 expend结构,通过增加模型宽度丰富细节信息,达到对注意力模块的加强14.3)为了关注不同尺度的信息,提升网络性能,首先,对输入特征分别进行33和55的卷积,获取不同尺度的特征,形成两条分支.其次,在不同分支上分别采用softmax结构和expend结构,捕获跨尺度特征.再次,对操作后的信息分别进行55和77的卷积,继续捕获多尺度特征.最后,将不同分支上注意到的信息经过softmax操作按元素相加,实现跨尺
19、度信息交互.1.3 融合WSA生成器生成器的结构如图3所示.即(I)DenseNet网络模块,()WSA模块.模型的卷积神经网络采用Tiramisu模型 15 代替了传统卷积模型.由于采用了密集块 16,所以增强了信息和梯度流.该模型的编码器有5个密集块且具有相同结构,解码器同样有5个密集块且具有相同结构,并且有一个15层的密集块作为瓶颈层.在编码器端,每个密集块后都有一个下采样(Transition Down,TD)层.TD 层 由 BatchNorm-Convolution-DropOut-AvgPool组成.类似地,在解码器端,每个密集块后面都有一个上采样(Transition Up,T
20、U)层,且 TU层仅具有解卷积操作.图3给出了生成器的具体模型,下面探讨引入DenseNet网络和WSA的必要性.ResNet模型的出现是CNN历史的重要事件,通过引入残差连接建立前后层之间的联系.若采用ResNet网络也可以实现去雾模型的设计,但是在相同规模之下,ResNet参数和计算成本都更大.因此本算法采用DenseNet网络架构,二者的对比实验在之后的消融实验中给出.DenseNet网络在参数和计算代价相同的情况下可以获得更好的性能,层数更深,性能得到较大的提升.在传统的对抗网络模型中,生成器模型在特征提取中会均等地处理每个通道特征,但是在实际的雾霾图像中,雾霾浓度的分布是不均匀的,均
21、等处理不同区域的特征会降低模型的泛化性,在无用的信息上浪费计算资源,所以在实际的训练中,应该赋予不同区域的特征不同的权重.引入WSA在特征提取的空间相关性中引入了非局部的思想,在特征提取过程中可以计算特征中像素之间的相关性,并根据特征相关性的大小增强特征信息,使算法根据不同区域的特征自动分配不同权重;并且通过多尺度的设计增强对跨尺度特征的提取与分析.将宽型自注意力模块WSA融合进每个密集块,如图4所示.将DenseNet模块输出特征送入注意力模块,再将注意力模块得到的输出特征与DenseNet模块的输出特征进行元素相加得到整个单一融合模块的输出.1.4 判别器算法所使用的判别器网络借鉴马尔科夫
22、判别器(Patch Discriminator,PD)17的思想,此模型会对目标图像和生成器生成的图像进行逐块比较,而不是逐图3 WSA融合DenseNet网络结构图Fig.3 WSA mechanism fusion DenseNet network structure diagram16第 8 期邬开俊等:宽型自注意力融合密集型残差网络的图像去雾像素比较,提高对图像中内容的判别能力.当图像通过卷积神经网络时进行比较,网络在输出处的感知域大于一个像素,也就是对应于原始图像中的像素块,所以使用Valid填充用于控制的有效感知域.实验中使用的7070判别器,在最后一组特征图上进行逐像素比较判别,
23、由于特征图上的有效感知域大于一个像素,因此它覆盖了图像的一部分,这样就可以消除了图像中的大量“伪像”.图5详细展示了判别器模型,它输入真实图像与生成器生成的图像,在后边加入WSA模块,在输出端输出一个3030矩阵,用来得出判别结果.1.5 损失函数1.5.1 条件对抗损失函数条件生成对抗网络损失如公式(2)所示,在本系统的模型中,执行一次生成器更新,然后每次迭代执行一次判别器更新,将结果乘以权重,然后将其加到总的损失当中.LAdv=E(x,y)log(D(x,y)+E(x,y)log(1-D(x,G(x,z)(2)式中:D为判别器;G为生成器;x为输入的雾霾图像;y为雾霾图像对应的清晰图像;z
24、为生成器生成的图像;E为数学期望.使用对抗损失主要是为了减少标注的数据,为了让少量的标注能达到大量标注的效果,以便可以模拟各种噪声,本系统使用 dropout作为噪声源.具体的做法是在真实的数据中加入噪声,让有无标注的数据都在一起学习.1.5.2 Smooth L1损失函数使用加权的 smooth L1损失与对抗损失一起减少了输出图像中的“伪像”.在对目标图像和生成器生成图像的对比中,为了防止出现正负抵消的情况,使用L1损失函数,对像素之差取绝对值.但由于L1损失在0点的导数不存在,所以可能存在不收敛的情况,因此使用平滑之后的L1损失函数使其更加容易收敛.目标图像y和生成的图像G(x,z)之间
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 注意力 融合 密集型 网络 图像
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。