基于模糊核估计的图像盲超分辨率神经网络.pdf
《基于模糊核估计的图像盲超分辨率神经网络.pdf》由会员分享,可在线阅读,更多相关《基于模糊核估计的图像盲超分辨率神经网络.pdf(13页珍藏版)》请在咨信网上搜索。
1、基于模糊核估计的图像盲超分辨率神经网络李公平1陆耀1王子建1吴紫薇1汪顺舟1摘 要模糊图像的超分辨率重建具有挑战性并且有重要的实用价值.为此,提出一种基于模糊核估计的图像盲超分辨率神经网络(Blurredimageblindsuper-resolutionnetworkviakernelestimation,BESRNet).该网络主要包括两个部分:模糊核估计网络(Blurkernelestimationnetwork,BKENet)和模糊核自适应的图像重建网络(Kerneladaptivesuper-resolutionnetwork,SRNet).给定任意低分辨率图像(Low-resolu
2、tionimage,LR),首先利用模糊核估计子网络从输入图像估计出实际的模糊核,然后根据估计到的模糊核,利用模糊核自适应的图像重建子网络完成输入图像的超分辨率重建.与其他图像盲超分辨率方法不同,所提出的模糊核估计网络能够显式地从输入低分辨率图像中估计出完整的模糊核,然后模糊核自适应的图像重建网络根据估计到的模糊核,动态地调整网络各层的图像特征,从而适应不同输入图像的模糊.在多个基准数据集上进行了有效性实验,定性和定量的结果都表明该网络优于同类的图像盲超分辨率神经网络.关键词模糊图像,模糊核估计,卷积神经网络,盲超分辨率引用格式李公平,陆耀,王子建,吴紫薇,汪顺舟.基于模糊核估计的图像盲超分辨
3、率神经网络.自动化学报,2023,49(10):21092121DOI10.16383/j.aas.c200987Blurred Image Blind Super-resolution Network via Kernel EstimationLIGong-Ping1LUYao1WANGZi-Jian1WUZi-Wei1WANGShun-Zhou1AbstractBlindblurredimagesuper-resolutionischallengingandhasimportantapplicationvalues.Thispaperpro-posesablurredimageblinds
4、uper-resolutionnetworkviakernelestimation(BESRNet),whichmainlyincludestwoparts:Blurkernelestimationnetwork(BKENet)andkerneladaptivesuper-resolutionnetwork(SRNet).Givenalow-resolutionimage(LR),thenetworkusestheblurkernelestimationsubnetworktoestimatetheblurkernelfromtheinputimage,andthenitusesthekern
5、eladaptivesuper-resolutionsubnetworktosuper-resolvetheinputlow-resolutionimage.Differentfromotherblindsuper-resolutionmethods,theproposedblurkernelestimationsubnet-workgivesthewholeblurkernel,thenthekerneladaptivesuper-resolutionsubnetworkdynamicallyadjuststheim-agefeaturesofdifferentnetworklayersac
6、cordingtotheestimatedblurkerneltoadapttodifferentimagedegrada-tions.Inthispaper,extensiveexperimentsarecarriedoutonmultiplebenchmarkdatasets.Thequalitativeandquantitativeresultsshowthatproposedmethodissuperiortootherblindsuper-resolutionmethods.Key wordsBlurredimage,blurkernelestimation,convolutiona
7、lneuralnetwork,blindsuper-resolutionCitationLiGong-Ping,LuYao,WangZi-Jian,WuZi-Wei,WangShun-Zhou.Blurredimageblindsuper-resolu-tionnetworkviakernelestimation.ActaAutomaticaSinica,2023,49(10):21092121图像超分辨率任务的主要目标是将输入的低分辨率图像(Low-resolutionimage,LR)重建成具有更多细节的高分辨率图像(High-resolutionimage,HR).图像超分辨率技术已经具
8、有广泛的应用,如遥感图像分析1、医学图像处理2、视频监控图像处理3等.近年来,随着深度学习技术的发展,基于深度学习的方法在图像超分辨率任务上取得了显著进展.其中大部分方法419只学习由双三次插值(Bicu-bic)算法退化生成的低分辨率图像与高分辨率图像之间的映射关系.然而,现实生活中的低分辨率图像的退化模式是复杂且未知的,包含了多种因素(如模糊、噪声、压缩、几何失真等),其中模糊的影响最为重要.由于生成网络训练数据时未考虑模糊,将上述这些模型应用到现实生活的真实场景中其重建效果不理想,甚至会出现明显的模糊和伪影等现象20.为了解决真实场景图像超分辨率问题,研究者们提出了许多盲图像超分辨率方法
9、.一种代表性的方法是从输入的低分辨率图像中估计出所对应的模收稿日期2020-11-26录用日期2021-04-16ManuscriptreceivedNovember26,2020;acceptedApril16,2021国家自然科学基金(61273273),国家重点研究发展计划(2017YFC0112001),中央电视台基金(JG2018-0247)资助SupportedbyNationalNaturalScienceFoundationofChina(61273273),NationalKeyResearchandDevelopmentProgramofChina(2017YFC01120
10、01),andFundsbyChinaCentralTelevi-sion(JG2018-0247)本文责任编委张向荣RecommendedbyAssociateEditorZHANGXiang-Rong1.北京理工大学计算机学院北京1000811.SchoolofComputerScienceandTechnology,BeijingInsti-tuteofTechnology,Beijing100081第49卷第10期自动化学报Vol.49,No.102023年10月ACTAAUTOMATICASINICAOctober,2023糊核并用来针对性地指导图像超分辨率重建.例如,Zhang等2
11、1使用网格搜索的方式来确定模糊核的参数,并且提出了维度拉伸策略来利用模糊核信息.Gu等22提出一种迭代模糊核修正的方法(Iterat-ivekernelcorrection,IKC)来估计输入图像的模糊核,并结合维度拉伸策略21和空间特征变换(Spa-tialfeaturetransform,SFT)23来利用模糊核信息重建高分辨率图像.Luo等24沿用了 Gu等22的方法来利用模糊核信息,并且提出迭代地进行模糊核估计和图像超分辨率重建.但是上述方法没有显式地从输入图像中估计出完整的模糊核,无法给出模糊核估计的质量评价,也无法评价估计到的模糊核对最终超分辨率结果的影响.此外,上述几种方法都使用
12、主成分分析(Principalcomponentanalysis,PCA)将模糊核拉成的向量进行降维,然后将降维后的模糊核向量拉伸成和输入图像一样大小的退化图,再将退化图和输入图像21或图像特征22,24在通道维度上拼接来利用模糊核信息帮助超分辨率重建.这种做法具有一定的局限性,首先这样做会丢失一部分模糊核中的信息,不能充分地利用模糊核信息去指导输入图像中结构化信息的重建.其次,这种做法只是简单地将图像或图像特征和模糊核特征在通道维度上拼接来利用模糊核信息.其中图像特征是与输入图像的像素值高度相关的,而由模糊核得到的退化图只是一组抽象的数字,将这二者简单拼接无法高效地利用模糊核信息去指导超分辨
13、率重建过程.为了克服上述局限,本文提出了一种基于模糊核估计的图像盲超分辨率神经网络(Blurredim-ageblindsuper-resolutionnetworkbasedonker-nelestimation,BESRNet).BESRNet主要包括两部分:模糊核估计网络(Blurkernelestimationnetwork,BKENet)和模糊核自适应的图像重建网络(Kerneladaptivesuper-resolutionnetwork,SR-Net).此外,为了充分利用模糊核信息帮助超分辨率重建,本文还提出模糊核特征提取器(Blurkernelfeatureextractor,
14、BKFE),用于从估计出的模糊核中提取关键信息.给定任意低分辨率图像,BKEN-et从中显式地估计出完整的模糊核.紧接着,BKFE从估计出的模糊核中提取模糊核特征.最后,SR-Net利用提取到的模糊核特征对图像特征进行调整并完成输入图像的超分辨率重建.特别地,在 SR-Net 中本文利用提出的模糊核自适应特征选择模块(Kerneladaptivefeatureselection,KAFS),根据模糊核特征对提取到的图像特征进行动态选择,从而更高效地利用模糊核信息.本文在多个图像超分辨率数据集上进行了大量实验,定性和定量的结果证明了提出方法的有效性.本文的主要贡献总结如下:1)设计了一个模糊核估
15、计网络 BKENet来估计输入低分辨率图像对应的模糊核.与其他盲超分辨率方法中只估计出经由 PCA 降维后的模糊核向量不同,BKENet能够显式地从输入图像中估计出完整的模糊核,从而能够直观地评价估计的模糊核的质量.2)设计了一个模糊核自适应的特征选择模块KAFS,从而利用提取到的模糊核特征指导输入图像的超分辨率重建.与之前的方法不同,本文使用在所估计的模糊核上提取到的特征来指导输入图像的超分辨率重建.给定模糊核特征和低分辨率图像特征作为输入,KAFS模块能够根据模糊核特征动态地为当前层级网络选择合适的特征,从而更有效地利用模糊核信息来指导图像超分辨率重建.1相关工作1.1模糊核估计模糊核估计
16、是图像处理领域内的一个热点问题并得到了广泛的研究.常振春等25将图像的稀疏先验和结构自相似性先验作为正则约束来求解模糊核和清晰图像.Pan 等26提出了一个新的非线性模型用于处理图像中过饱和的像素点,并且设计了更加鲁棒的能量函数来估计模糊核.Yan 等27首先使用一个分类网络来确定输入图像中包含的模糊的种类,然后使用一个回归网络来估计对应的模糊核.上述方法都是在模糊图像上估计模糊核,而本文需要从输入的低分辨率图像中估计出对应的模糊核,其中低分辨率图像是模糊图像进行下采样得到的.所以之前提到的方法并不适用于盲超分辨率问题中的模糊核估计.Zhang等21使用网格搜索的方式来确定模糊核的参数.Gu等
17、22提出迭代修正的框架来不断修正估计到的模糊核向量.Luo等24提出迭代地进行模糊核估计和超分辨率重建.然而这些方法都只是估计出模糊核经由 PCA降维后的模糊核向量,并没有显式地从低分辨率图像中估计出完整的模糊核,导致难以对估计出的模糊核进行直观的质量评价.为了解决这个问题,本文设计了一个新的模糊核估计网络 BKENet,用于从低分辨率图像中估计完整的模糊核.1.2图像超分辨率基于深度学习的图像超分辨率方法通过设计深度神经网络来学习低分辨率图像与高分辨率图像之间的非线性映射.代表性的图像超分辨率方法可分为以下 4 类:1)基于残差学习的方法58.这类方法2110自动化学报49卷专门设计网络来学
18、习高分辨率与低分辨率图像之间的高频残差,重建图像的低频部分由输入的低分辨率图像来进行补充.2)基于递归神经网络(Recurs-iveneuralnetwork,RNN)的方法912.基于 RNN的图像超分辨率方法通过共享参数的方式能够在不引入额外参数的情况下增加网络的深度和感受野并提升最终的效果.3)基于密集残差连接的方法1316.这类方法通过向网络中引入密集残差连接来打通网络不同层之间的数据和梯度流动,获得更加高效的特征表达从而带来性能上的提升.4)基于注意力机制的方法1719.通过向网络中引入注意力机制,这类方法可以让网络更加注重于重建高分辨率图像中的高频信息,例如纹理边缘等,最终提升重建
19、结果的精度.然而,上述方式仅针对双三次插值一种退化方式进行研究,未考虑其他退化方式.因此,直接将上述方法应用于多种退化模式生成的低分辨图像时模型性能会下降.为了解决这个问题,研究者们提出了许多盲图像超分辨率方法.主要包括以下 3 类:1)基于图像域转换的方法2829.这类方法将低分辨率图像和高分辨率图像分别看作是两个图像域,然后借鉴图像域转换的思想对输入的低分辨率图像进行超分辨率重建.2)基于内部学习的方法3031.这类方法通过挖掘输入低分辨率图像内部的重复信息,如色彩纹理等,来进行自学习并完成超分辨率重建.3)基于建模退化过程的方法2122,24.这类方法使用多种模糊核来模拟真实的退化过程,
20、生成更加贴近真实世界低分辨率图像的训练数据,并且针对该模型设计网络完成超分辨率重建.本文方法属于上述最后一类盲超分辨率方法.与之前的工作不同,本文提出了一种新的基于模糊核估计的图像盲超分辨率网络 BESRNet.首先从输入的低分辨率图像中显式地估计出完整的模糊核,然后根据所估计的模糊核,动态地调整不同层级网络的图像特征,完成输入图像的超分辨率重建.2BESRNetxkksr.本文提出的 BESRNet结构如图 1所示,其包含两部分:模糊核估计网络(BKENet)和模糊核自适应的图像重建网络(SRNet).BKENet从输入的低分辨率图像中估计出模糊核,SRNet根据估计到的模糊核动态地调整各层
21、网络的特征,实现图像超分辨率重建.具体来说,给定任意的低分辨率图像,BKENet从中估计出对应的模糊核,然后模糊核特征提取器(BKFE)从估计到的模糊核 中提取特征,SRNet利用模糊核特征对从输入图像中提取到的图像特征进行适应性的调整,最终输出高分辨率图像 整个过程可形式化表示为k=(x)(1)Fk=(k)(2)sr=(x,Fk)(3)()()Fk()其中,代表 BKENet,代表模糊核特征提取器,代表提取到的模糊核特征,代表 SRNet.BKENet 的介绍见第 2.1 节,SRNet中起特征调整作用的 KAFS模块介绍见第 2.2 节,模糊核特征提取器用一个简单的卷积网络实现,其结构如图
22、 1中标注所示.2.1模糊核估计网络当使用与真实模糊核不相符的模糊核作为先验时,图像超分辨率网络的性能会有明显的下降32,ConvConvReLUKAFS残差块残差块残差块残差块Pixel shuffleConvBKENetConvBNReLU模糊核特征提取器数据流全局池化SRNet图1BESRNet结构示意图Fig.1OverviewoftheBESRNet10期李公平等:基于模糊核估计的图像盲超分辨率神经网络2111并且会产生过于平滑或锐化的结果22.因此,准确地从输入的低分辨率图像中估计出模糊核十分必要.1)当前模糊核估计方法当前主流模糊核估计方法26,33将模糊图像和清晰图像之间关系建
23、模为b=l k+n(4)b,l,k,n其中,分别代表模糊图像、清晰图像、模糊核和加性白高斯噪声,代表卷积操作.它们通过优化式(5)所示问题来获取清晰图像和模糊核minl,kb l k22+1Rl+2Rk(5)1Rl2Rk其中,和 分别代表清晰图像和模糊核的正则项.具体来说,给定一个初始化模糊核,清晰图像和准确的模糊核可由式(6)和式(7)迭代优化获得li+1=argminlb l ki22+1Rl(6)ki+1=argminkb li k22+2Rk(7)然而,上述方法并不适用于本文的问题,因为这些方法都是针对高分辨率的模糊图像进行设计,没有考虑下采样操作.而本文需要从输入的低分辨率图像中估计
24、出对应的模糊核,其中低分辨率图像是模糊图像下采样获得的,与原始的模糊图像的数据分布有差异.同样,一些图像盲超分辨率方法22,24也会估计低分辨率图像中包含的模糊,但是它们只估计出经由 PCA 降维后的模糊核向量,导致无法直观地对估计到的模糊核进行质量评价.为了解决这个问题,本文设计了 BKENet用于从输入的低分辨率图像中估计出完整的模糊核.2)BKENet本文参考 ResNet1834设计了一个新的模糊核估计网络 BKENet,用于从输入的任意尺寸的低分辨率图像中估计出模糊核,其结构如图 2所示.本文在 ResNet1834中的全连接层之前插入了一个全局池化层,将从输入图像中提取到的特征在特
25、征维dd d度上进行统一.本文也对全连接层进行了改变,根据模糊核大小 将输出层的神经元个数改为 个,网络的输出是模糊核拉成的向量,经过变形得到对应的模糊核.BKENet 的优化目标为B=argminB(x;B)k22+(x;B)(8)x()Bk()其中,代表输入低分辨率图像,代表BKENet,代表BKENet的参数,代表待估计模糊核的真值,代表正则项.对于正则项,本文考虑两个方面问题:1)估计得到的模糊核中的权值总和应该等于 1,否则会导致模糊核的能量溢出;2)估计得到的模糊核的质心应该在整个模糊核的中心位置,因为本文生成数据所用高斯模糊核的质心在其正中心.故本文定义正则项为(x;kp)=Rs
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 模糊 估计 图像 分辨率 神经网络
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。