基于生成对抗网络的图像修复算法.pdf
《基于生成对抗网络的图像修复算法.pdf》由会员分享,可在线阅读,更多相关《基于生成对抗网络的图像修复算法.pdf(7页珍藏版)》请在咨信网上搜索。
1、基于生成对抗网络的图像修复算法黄健,韩俊楠(西安科技大学通信与信息工程学院,西安710600)通信作者:韩俊楠,E-mail:摘要:为解决当前基于生成对抗网络的深度学习网络模型在面对较复杂的特征时存在伪影、纹理细节退化等现象,造成视觉上的欠缺问题,提出了连贯语义注意力机制与生成对抗网络相结合的图像修复改进算法.首先,生成器使用两阶段修复方法,用门控卷积替代生成对抗网络的普通卷积,引入残差块解决梯度消失问题,同时引入连贯语义注意力机制提升生成器对图像中重要信息和结构的关注度;其次,判别器使用马尔可夫判别器,强化网络的判别效果,将生成器输出结果进行反卷积操作得到最终修复后的图片.通过修复结果以及图
2、像质量评价指标与基线算法进行对比,实验结果表明,该算法对缺失部分进行了更好地预测,修复效果有了更好的提升.关键词:图像修复;生成对抗网络;门控卷积;连贯语义注意引用格式:黄健,韩俊楠.基于生成对抗网络的图像修复算法.计算机系统应用,2023,32(10):215221.http:/www.c-s- Inpainting Algorithm Based on Generative Adversarial NetworkHUANGJian,HANJun-Nan(CollegeofCommunicationandInformationTechnology,XianUniversityofScienc
3、eandTechnology,Xian710600,China)Abstract:Thecurrentdepthlearningnetworkmodelsbasedongenerativeadversarialnetworksencounterartifacts,texturedetaildegradation,andotherphenomenawhenfacingmorecomplexfeatures,whichleadstoavisualdeficiency.Inordertosolvetheseproblems,animprovedimageinpaintingalgorithmcomb
4、iningagenerativeadversarialnetworkwithacoherentsemanticattentionmechanismisproposed.Firstofall,thegeneratoradoptsatwo-stageinpaintingmethod,usesgatedconvolutiontoreplacetheordinaryconvolutionofthegenerativeadversarialnetwork,andintroducesresidualblockstosolvethegradientvanishingproblemandacoherentse
5、manticattentionmechanismtoenhancethegeneratorsattentiontotheimportantinformationandstructureintheimage.Secondly,Markovdiscriminatorisadoptedtoenhancethenetworksdiscriminationeffect,andtheoutputresultsofthegeneratorareprocessedbydeconvolutiontogetthefinalrepairedimage.Bycomparingtheinpaintingresultsa
6、ndimagequalityevaluationindicatorswiththebaselinealgorithm,theexperimentalresultsshowthatthealgorithmcanbetterpredictthemissingpartsandimprovetheinpaintingeffect.Key words:imageinpainting;generativeadversarialnetwork(GAN);gatedconvolution;coherentsemanticattention图像修复的应用领域非常广泛,包括医疗、工业生产、军事、娱乐和卫星通讯等.
7、但由于在图像的传播扩散或者是保存的过程中,常有损坏、失真或者受到污染等问题,从而导致图像信息不完整,所以,在图像处理技术当中,图像修复技术属于一项十分重要的研究工作.图像修复技术可用于历史文物修复、旧照片修复、刑侦方面等.与图像去噪、图像去雾、图像去雨以及图像超分计算机系统应用ISSN1003-3254,CODENCSAOBNE-mail:ComputerSystems&Applications,2023,32(10):215221doi:10.15888/ki.csa.009257http:/www.c-s-中国科学院软件研究所版权所有.Tel:+86-10-62661041收稿时间:202
8、3-03-21;修改时间:2023-04-20;采用时间:2023-05-06;csa 在线出版时间:2023-08-22CNKI 网络首发时间:2023-08-23SoftwareTechniqueAlgorithm软件技术算法215等图像处理技术相对比,图像修复更强调根据图像内容、细节以及特征纹理进行修复,在对画面损坏或缺失部分进行补充的同时,还要确保色彩连贯协调以及质感得到适当延伸,同时,在图像存在较大面积的破损时,还要确保修复之后的图像内容与真实图像的一致性以及主观效果,使得修复后的图像尽可能还原原始图像并且能够符合人类视觉感官.在图像修复领域,基于生成对抗网络的深度学习网络模型展现出
9、其独特的优势,但是在面对较复杂的特征时往往无法实现很好的修复效果,存在伪影、纹理细节退化等现象,造成视觉效果上的欠缺问题.为了解决当前模型对大面积破损图像修复不友好以及修复后的图像存在退化现象等问题,通过对现有方法进行研究,改进了图像修复模型.本文的贡献如下:(1)修复模型采用两阶段修复结构,使用门控卷积解决部分像素缺失与大尺度损坏情况下的局部特征精确描述的问题,结合残差思想解决使用 Sigmoid 函数会出现梯度消失的问题;(2)在精修复阶段引入连贯语义注意机制,不仅关注已知区域和未知区域之间的联系,更能通过缺失区域间语义相关性进行建模,对生成区域像素资源再次分配,根据语义信息进行引导修复,
10、提升语义的连贯性.1相关工作由于深度学习技术1发展迅速,图像修复也渐渐成为了计算机视觉的热门研究方向.Goodfellow 等人2在 2014 年首次提出 GANs 应用于图像处理方面.Pathak等人3提出了 Context-Encoder 网络,将编码解码网络结构与生成对抗网络相结合,以对抗损失和图像重构损失作为约束条件提高模型的图像修复能力.Iizuka 等人4提出了全局和局部判别器网络,引入扩张卷积增大感受野,通过双判别器来提升网络对全局信息和局部信息的融合利用,使得图像修复结果不仅符合全局语义,整体也更加合理.Liu 等人5提出部分卷积修复方法,使用 U-Net 网络结构实现图像修复
11、.Yu 等人6提出了一种带有内容感知的前馈生成网络,将注意力机制引入到深度学习图像修复方法中.Yu 等人7提出了一种基于门控卷积的图像修复算法,采用两阶段生成结构.先是在生成器的第 1 阶段,提取图像中的语义信息;然后在生成器第 2 阶段将粗修复网络的结果作为输入,细化生成部分的内容,使生成图像的纹理结构更合理.2网络结构 2.1 修复网络体系结构生成器为两阶段修复,首先,第 1 阶段(粗修复阶段)输入被污染的图像以及污染区域的灰度图,通过网络提取图像中的语义信息;其次,第 2 阶段(精修复阶段)输入第 1 阶段的生成结果,引入连贯语义注意机制更好地对被污染区域以及未被污染区域进行关联,使修复
12、的纹理结构更加合理.两阶段组成完整的修复流程,具体修复网络结构如图 1 所示.由于门控卷积拥有独特的特征筛选能力,所以在生成器部分可以将其用于替代普通卷积,提高图像处理的效率.为了进一步提升处理效果,引入扩张卷积层8,从而拓展了感受范围,提供更丰富的特征信息,促进图像修复,并在模型设计中引入残差思想9,将门控卷积改为残差门控卷积,防止梯度消失问题.在生成器第2 阶段,通过使用连贯语义注意力来将局部特征和全局特征相关联,能够更好地理解图像的整体结构,提高图像的修复效果,解决图像修复细节退化、视觉欠缺问题.G1Gated convDilated res gated convCSAConvG2DCo
13、ncat图 1修复网络体系结构计 算 机 系 统 应 用http:/www.c-s-2023年第32卷第10期216软件技术算法SoftwareTechniqueAlgorithm 2.2 生成器2.2.1门控卷积门控卷积10最早出现在 NLP 的任务中,取得了良好的结果,Yu 等人7将其引入到图像修复网络.门控卷积学习每个通道和每个空间位置的动态特征选择机制,具体操作的计算公式表达如下:Gatingy,x=WgI(1)Featurey,x=WfI(2)Oy,x=(Featurey,x)(Gatingy,x)(3)WgWf其中,Sigmoid 激活函数用 表示,输出门控值范围为(0,1).可以
14、表示 ReLU、ELU 和 LeakyReLU 等任意激活函数.和代表两个不同的卷积滤波器.门控卷积结构如图 2 所示.OutputFeatureFeatureConvConvConvConvConvSoft gatingSoft gating图 2门控卷积结构图通过在标准卷积后接入 Sigmoid 激活函数,使得门控卷积可以实现软门控,对当前卷积层的输出结果在进入下一个卷积层之前进行加权.在硬门控中,使用0 或 1 来进行加权,但在软门控中,使用 0 到 1 进行加权,这样更加灵活,并且这种操作是可学习的.门控卷积特有的参数动态更新机制,对缺失区域进行动态学习,将缺失区域与已知区域进行有效的
15、动态区分,可以更好地解决局部特征精确描述问题.2.2.2扩张卷积Google 团队11提出的扩张卷积(dilatedconvolution)也被称为空洞卷积或膨胀卷积,它是在标准卷积核中注入空洞,通过拓宽图像的感受野来获取图像中更多的特征信息.相比普通卷积操作,扩张卷积多了个扩张率(dilationrate)参数,扩张率用来定量衡量卷积核超参数的扩张程度.传统的普通卷积就是扩张率为 1 的扩张卷积.图 3 为卷积核尺寸是 33,dilationrate 是 2的扩张卷积示意图.图 3扩张率为 2 的 33 卷积核的扩张卷积示意图从图 3 可以看出扩张率为 2 的 33 卷积核具有与55 卷积核
16、相同的视野,而且扩张卷积只使用了 9 个参数,也就是说,在相同的计算成本下,扩张卷积计算具有更宽的视野,从而能够捕捉更长的依赖关系.本文将 4 层扩张卷积应用于粗修复阶段的中间部分,扩张卷积层的扩张率自 2 起随层数递增而翻倍增加,将扩张率持续变大的扩张卷积层叠加在一起,以持续增加图像的感受野,从而加强网络对图像整体特征信息的提取和利用.2.2.3残差门控卷积门控卷积的输出门控值通过 Sigmoid 激活函数,输出值在.基于此,门控卷积避免了人为设置的更新方法,通过学习每个通道和每个空间位置的动态特征选择机制,由每一个通道进行动态特征选择,让网络自行学习每一个特征值位置.Sigmoid 激活函
17、数值域为(0,1),由于 Sigmoid 函数值趋近于 0 或 1 时变化平缓,如果隐藏层较多梯度接近 0 时会出现梯度消失问题,在图像修复中导致一些特征无侧重点,引入残差思想,用残差门控卷积替代门控卷积,图 4 为以带扩张的门控卷积为例的残差门控卷积结构.Dilated convDilated convSigmoidLeaky11 Conv输出输入ReLU图 4残差门控卷积结构从图 4 可以看出,在门控卷积的基础上加上一个11 的残差块构成残差门控卷积,对输入的有效特征信息进行卷积,卷积核大小为 11,最后将 11 卷积的输出添加到原门控卷积输出上,目的是提升对有效像素的使用.2.2.4连贯
18、语义注意图像修复任务仅考虑缺失区域与已知区域之间的2023年第32卷第10期http:/www.c-s-计 算 机 系 统 应 用SoftwareTechniqueAlgorithm软件技术算法217关系是不够的,因为其忽略了缺失区域的内容,为了达到更好的图像修复效果,将连贯语义注意(coherentsemanticattention,CSA)层12用于图像修复任务重,不仅分析了缺失区域特征之间的语义相关性,而且可以从已知区域提取缺失区域的信息,通过分析远距离的图像信息、缺失区域之间的关系,可以保证修复结果的局部连续性.MMMmii (1 n)nMmimimim1i1CSA 分为两个阶段实现:
19、搜索和生成.图 5 为CSA 的搜索和生成操作.每张待修复图片中用表示当前图像受污染部分的信息,表示图像中可见的可参考信息,对于中每个(11)生成的补丁(,是补丁的数量),CSA 层在已知区域中搜索最接近匹配的上下文补丁,以在搜索过程中初始化,然后将设置为主要部分,将所有先前生成的补丁()设置为次要部分,以在生成过程中恢复.为了衡量这两个部分的权重,采用以下互相关度量:Dmaxi=mi,mimimi(4)Dadi=mi,mi1mimi1(5)DmaximimiDadiDmaxiDadi其中,代表和上下文区域中最相似的补丁之间的相似度,代表两个相邻生成的补丁之间的相似性.和分别被归一化为上下文补
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 生成 对抗 网络 图像 修复 算法
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。