基于掩码预测和多尺度上下文聚合的人脸图像修复算法.pdf
《基于掩码预测和多尺度上下文聚合的人脸图像修复算法.pdf》由会员分享,可在线阅读,更多相关《基于掩码预测和多尺度上下文聚合的人脸图像修复算法.pdf(10页珍藏版)》请在咨信网上搜索。
1、 年 无线电工程 第 卷 第 期:引用格式:孙剑明,吴金鹏,沈子成,等基于掩码预测和多尺度上下文聚合的人脸图像修复算法无线电工程,():,():基于掩码预测和多尺度上下文聚合的人脸图像修复算法孙剑明,吴金鹏,沈子成,彭俄祯(哈尔滨商业大学 计算机与信息工程学院,黑龙江 哈尔滨)摘要:针对现有图像修复算法存在生成不合理的内容和修复后纹理不清晰等问题,在生成对抗网络(,)的框架下,提出了一种基于掩码预测和多尺度上下文聚合的人脸图像修复算法。算法通过堆叠多层的多尺度上下文聚合模块(,)构造的生成器进行特征提取,融合了来自不同感受野的特征,可以捕捉遥远距离的上下文信息和感兴趣的模式进行上下文推理。使用
2、掩码预测的(,)判别器,迫使判别器区分真实和生成的的纹理细节。使用跳跃连接将编码器中每一层卷积层的输出与解码器对应位置的输入在通道维度上拼接,使图像的上下文信息向更高层分辨率特征图传播。使用对抗损失对判别器训练,使用损失、对抗损失、感知损失和风格损失的加权联合损失函数对生成器进行训练,并在公开数据集下进行实验。实验结果表明,所提修复算法在破损比例为 掩码下的损失为 ,峰值信嗓比(,)为,结构相似性(,)为,弗雷歇初始距离(,)为,该算法能够有效修复人脸图像且修复结果语义一致性高、纹理细节清晰。关键词:图像生成;图像修复;生成式对抗网络;掩码预测;多尺度上下文聚合中图分类号:文献标志码:开放科学
3、(资源服务)标识码():文 章 编 号:(),(,):,(),(),(),(),()():;收稿日期:基金项目:国家自然科学基金():()信号与信息处理 引言图像修复是指利用已知上下文信息填充图像中缺失的区域。尽管研究人员已经提出许多图像修复方法,无论是传统算法还是现有深度学习算法,在修复图像时都难以同时恢复合理的内容和清晰的纹理。早期的图像修复工作试图通过基于扩散或基于补丁的算法来解决这一问题。基于扩散的算法将上下文信息从边界传播到等照度线方向的孔洞(缺失区域)中。基于补丁的算法通过从未损坏的图像区域或外部数据库复制相似的补丁来合成缺失区域。现有的深度模型在低分辨率图像的语义修复方面已经表现
4、出良好的效果。但在更高分辨率(如 )使用这些深度模型往往会生成不合理的内容且纹理细节不真实,阻碍了用户在高分辨率图像中的实际应用。为了克服以上种问题,提出了一种基于掩码预测和多尺度上下文聚合的人脸图像修复模型。它包括一个以编码器、多尺度上下文聚合模块(,)、解码器为框架的生成器网络和一个以掩码预测为训练任务的判别器网络。为了在破损图像生成合理的内容,通过堆叠多个。通过使用各种扩张率的空洞卷积来利用遥远的距离上下文信息进行上下文推理,同时通过拼接多个特征图来实现多尺度的特征融合。使用跳跃连接将编码器中每一层卷积层的输出与解码器对应位置的输入在通道维度上拼接,使得图像的上下文信息向更高层分辨率传播
5、,从而为缺失区域生成更合理的内容。为了生成真实的纹理细节,使用了一种新颖的掩码预测任务来训练判别器。大多数现有的深度模型使用了带有谱归一化的判别器,从而迫使判别器将修复图像中的所有补丁块预测为假,而忽略了那些缺失区域之外的补丁块确实来自真实图像的事实。因此,这些深度模型可能难以生成逼真的细粒度纹理。为了克服以上问题,使用掩码预测的(,)判别器,迫使判别器区分真实和生成的小块(缺失区域)的纹理细节。换句话说,对于修复图像,判别器期望从真实图像中分割出合成的图像块。这样的学习目标导致了一个更强的判别器,并且反过来促进生成器来合成逼真的细粒度纹理。本文的贡献如下:首次提出了和判别器。进行特征提取,融
6、合了来自不同感受野的特征图,可以用来捕捉遥远距离的上下文信息和感兴趣的模式增强上下文推理。判别器迫使判别器区分真实和生成的小块(缺失区域)的纹理细节,进一步提升人脸面部修复性能。设计了一种基于掩码预测和多尺度上下文聚合的人脸图像修复网络,以便生成合理的内容和逼真的纹理。本文设计的模型与其他主流的基于深度学习模型进行定量、定性评估,且评价结果优于其他深度模型。相关工作由于图像修复对图像编辑应用(如物体移除和图像复原)的重要实用价值,图像修复已然成为近几十年来活跃的研究课题之一。现有的修复算法可以分为类:基于传统的算法和基于深度学习的算法。基于传统的图像修复算法基于扩散的算法沿着等照度线方向将上下
7、文像素从边界传播到孔洞。具体地,在像素传播期间,通过使用偏微分方程来施加许多边界条件。然而,这些方法通常会引入扩散相关的模糊,因此无法完成大面积缺失区域。基于补丁的算法通常通过从已知的图像上下文或外部数据库复制和粘贴相似的补丁块来合成丢失的内容。然而,这些方法在完成复杂场景的大面积缺失区域的语义修复方面存在不足。这是因为基于补丁的方法严重依赖于通过低级特征的逐片匹配。这种技术不能合成已知区域中不存在类似补丁的图像。传统算法往往在修复面积较小、纹理结构较为简单时有比较好的效果。一旦缺失区域比较大(以上)时,修复效果往往会特别差。这是因为传统的图像修复算法往往不能深层地理解图像中的语义信息。因此,
8、随着年之后深度学习的火热,越来越多从事图像修复的研究人员开始采用深度学习方法以获取更深层次的语义信息理解以及更高质量的修复效果。基于深度学习的图像修复算法深度特征学习和对抗训练的出现使得图像修复取得了重大进展。与基于传统算法相比,深度修复模型能够为复杂的场景生成合理的内容和逼真的细粒度纹理。信号与信息处理 年 无线电工程 第 卷 第 期 等提出了上下文编码器(,)模型,利用潜在特征空间中的通道等宽全连接层()将编码特征和解码特征连接。该模型首次使用生成对抗网络(,)框架,生成器由编码器、解码器组成。取前层作为编码器,解码器部分则由反卷积实现从高维特征向图像真实大小的转变。通过模型已经能使街景、
9、人脸生成有希望的结果。然而,由于使用了通道等宽全连接层,使得该模型只能处理固定大小()的图像。结构如图所示。图结构 针对上述问题,等提出在全卷积网络(,)建立模型,使得该模型能处理任意大小的图像。为了生成逼真的细粒度纹理,通过采用的框架进行语义修复,已经取得了重大进展。通过生成器和判别器之间的博弈论最小最大博弈,基于的修复模型能够生成更清晰的纹理。为了进一步改进判别器网络,通过全局和局部判别器进行联合训练,从而达到全局和局部一致性。结构如图所示。图结构 然而,由于中判别器网络使用了全连接层,局部判别器只能处理固定形状的缺失区域。为了解决这一问题,等继承了判别器,判别器旨在区分真实图像的和修复图
10、像的。但基于的模型通常忽略了这样一个事实:那些缺失区域之外的补丁块确实来自真实图像的事实,并且盲目地促进判别器来区分这些相同的补丁块是假的,因此会削弱生成器生成缺失区域之外的真实块的真实内容。除此之外,为了捕获基于的远距离上下文,提出了上下文注意力模块,以通过逐片匹配从上下文中找到感兴趣的补丁块。等提出的网络结构如图所示。图上下文注意力机制网络结构 等提出部分卷积层代替标准卷积来处理缺失区域内外颜色差异和伪影的问题。部分卷积将像素分为有效和无效像素,且只对有效像素做卷积。等在上下文注意力模块的基础上使用了门控卷积学习掩码的分布,进一步提升了修复性能。等提出了上下文残差聚合(,)机制,该机制可以
11、通过对上下文信息中的残差进行加权聚合来生成缺失区域的高频残差,提出的网络仅需输入低分辨率图像,再将低分辨率修复结果和高频残差合并得到高分辨率图像。传统的图像修复算法只适用于修复与背景相似的纹理,但人脸图像面部成分之间存在紧密的相关性,人脸修复结果应当具有全局语义的合理性,如眉信号与信息处理 毛对齐、眼睛对齐等。因此,传统的图像修复算法不适用于人脸图像修复。随着的发展,有关深度学习的人脸图像修复算法性能不断提升。现有基于深度学习的人脸图像修复算法主要分为类:基于全连接层的算法、基于的算法、基于注意力机制的算法和基于掩码更新的算法。文献提出的网络使用通道等宽全连接层完成脸部特征的长程迁移,但由于使
12、用了全连接层,其网络只能使用固定大小的人脸图像。针对这一问题,文献首次提出使用进行人脸修复,使其能处理任意大小的人脸图像。文献提出了上下文注意力模块,该模块具有优秀的脸部特征长程迁移能力。但是,这个模块大尺寸图像会占用巨大的显存,因此无法在多尺度特征上使用,修复结果仍然会出现全局语义信息不合理的情况。文献和文献使用不同掩码更新策略进一步提升了局部语义修复性能。但是,其在全局语义上存在如左右眼不对称等不合理的问题。网络结构 受 网络的启发,将标准卷积层拆分为个子层,每个子层拥有较少的输出通道,如图所示。首先,使用个不同大小(、)的转化为个特征图。其次,将具有个输出通道的标准卷积层拆分为个子层,使
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 掩码 预测 尺度 上下文 聚合 图像 修复 算法
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。