基于注意力机制的轻量级水下图像风格迁移方法.pdf
《基于注意力机制的轻量级水下图像风格迁移方法.pdf》由会员分享,可在线阅读,更多相关《基于注意力机制的轻量级水下图像风格迁移方法.pdf(8页珍藏版)》请在咨信网上搜索。
1、第 卷第期 年月杭州师范大学学报(自然科学版)()收稿日期:修回日期:基金项目:浙江省基础公益研究计划项目()通信作者:王奔(),男,教授,博士,主要从事物联网、智慧城市的应用技术研究 :犱 狅 犻:基于注意力机制的轻量级水下图像风格迁移方法王希雅,王奔(杭州师范大学信息科学与技术学院,浙江 杭州 )摘要:目前,获取海洋素材的途径稀少,数据集缺失,质量相对较低,是海洋生态环境保护宣传、水下图像应用设计的重大难题之一本文将基于深度学习的图像风格迁移技术与白化现象严重的水下图像进行结合,引入 轻量级编码器网络,通过低秩卷积、压缩模块和全连接操作,在不影响模型准确率的条件下减少模型参数冗余,减少模型
2、计算量同时,本文还进一步引入了关系感知全局注意力转换网络,结合特征和特征位置的相关性更有效地平衡全局和局部结构信息此外,在损失函数中加入 色相损失函数,通过色相值的计算来衡量颜色的距离,由此更好地表示颜色的相近关系通过学习图像的内容、风格等特征进行照片风格迁移,解决海洋图像设计素材短缺、图像质量低等问题,从而增加水下图像样式的多元性、素材的丰富性以及资源的拓展性关键词:风格迁移;编码器解码器;注意力机制;损失函数中图分类号:文献标志码:文章编号:()研究背景及意义现代科学通常会通过水下环境图像来了解当前海域水下生态环境的变化发展,同时为海洋生态环境宣传提供丰富的素材然而海洋资源持续衰减,海洋的
3、生态环境不断被破坏,海洋中的动物、植物等都受到了不同程度的伤害,白化现象日渐显著,给人类研究和认识海洋信息带来巨大的阻碍和挑战目前,无论是在水下图像增强领域还是水下图像目标检测领域都需用到水下图像数据集,然而,公开的水下图像数据集数量少且图像也少,不利于研究的开展此外,由于海洋环境复杂多样、水下光照条件有限,导致获取到的水下图像清晰度和图像质量都较低,不利于对海洋素材的整合和利用因此,通过风格迁移技术与现代表现手法相结合,来获取具有丰富艺术生命和符合真实情况的海洋素材,成为目前主要的研究课题随着风格迁移应用领域逐渐广泛、应用场景逐渐复杂,这些任务对卷积神经网络性能的要求也越来越高为了获得更好的
4、性能,就要不断地加深网络的深度或者增加模块的复杂程度与此同时会带来两个问题,首先是存储参数庞大,需要耗费大量存储资源,其次是运行时间,只有毫秒级的运行时间才能满足实际应用的要求除了对模型提出更高要求之外,对网络学习性能也提出了一定的要求在图像视觉任务中,网络模型往往需要通过快速扫描全局图像来获得需要关注的目标区域,而这过程中如何高效分配有限的注意力资源也成为一大难题在此基础上,照片风格迁移更加重视图像色彩分布和色彩平衡,因此,网络模型除了要提升模型运行效率,保留内容主体结构之外,更要结合风格图像的色彩风格,生成既真实又美观的迁移图像为解决上述问题,本文尝试将基于深度学习的图像风格迁移技术与白化
5、现象严重的水下图像进行结合,提出一种基于关系感知全局注意力的轻量级水下图像照片风格迁移方法通过引入 轻量级编码器网络,在不影响模型准确率的条件下减少模型参数冗余,提高模型计算的效率同时,引入了关系感知全局注意力转换网络,结合特征和特征位置的相关性更有效地平衡全局和局部结构信息此外,在损失函数中加入 色相损失函数,通过色相值的计算来衡量颜色的距离,由此更好地表示颜色相近的关系通过学习图像特征结合注意力机制等方法进行真实感的水下图像风格迁移,以解决水下图像设计素材短缺、数据集缺少和图像质量差等问题,从而增加水下图像样式的多元性、素材的丰富性以及资源的拓展性基于关系感知全局注意力的轻量级水下图像照片
6、风格迁移算法 模型构建由于编码器解码器架构拥有“图到图”转换的优势,本章基于编码器解码器构建了如图所示的风格迁移模型,该模型主要由 轻量级网络、关系感知全局注意力、动态实例归一化和损失函数模块组成其中 用于内容编码,减少网络参数量和计算成本;关系感知全局注意力用于增强特征的表示能力;模块参数根据不同的风格自适应地改变,能更精确地对齐复杂风格的特征统计信息;损失函数用于对风格迁移网络进行迭代优化图网络结构犉 犻 犵 犖 犲 狋 狑 狅 狉 犽狊 狋 狉 狌 犮 狋 狌 狉 犲 轻量级编码器网络图犛 狇 狌 犲 犲 狕 犲 犖 犲 狓 狋网络结构犉 犻 犵 犛 狇 狌 犲 犲 狕 犲 犖 犲 狓
7、狋狀 犲 狋 狑 狅 狉 犽狊 狋 狉 狌 犮 狋 狌 狉 犲本文选择 网络结构如图所示,其主要操作有如下几个步骤:)低秩卷积核低秩分解设计的核心就是用小矩阵近似代替大矩阵,这样极大地减少了网络的参数数量,同时增加了网络的深度;)模块压缩深度卷积虽然确实能够减少计算量,但是实际在终端设备上的运行效率并不高,通过模块压缩有效地减少参数量,提高模型运算效率;)全连接层 相比于 中全连接层占比极高的参数量,通过瓶颈层压缩全连接层的输入维度减少了网络的参数量由图橙色部分可以看出,网络将犓犓卷积分解为两个大小分别为犓和犓的可分离卷积,有效地将参数的数量从犓减少到犓,并且在减少参数量的同时增加了网络的深度
8、杭州师范大学学报(自然科学版)年 关系感知全局注意力本章引入的“关系感知全局注意力”(,)模块,如图所示在全局的结构信息上,能够进行有效的获取和高效的利用 模块利用浅层卷积来学习注意力,核心是通过特征计算连接,将成对相关性亲和力与其叠堆起来,来获取更全面和丰富的全局结构信息和局部信息,从而学习到更容易判别的高质量显著特征图关系感知全局注意力模块结构犉 犻 犵 犜 犺 犲 狊 狋 狉 狌 犮 狋 狌 狉 犲狅 犳 狉 犲 犾 犪 狋 犻 狅 狀 狊 犺 犻 狆犪 狑 犪 狉 犲犵 犾 狅 犫 犪 犾 犪 狋 狋 犲 狀 狋 犻 狅 狀犿 狅 犱 狌 犾 犲 损失函数 色相损失函数 颜色模型适合用
9、于表示颜色相近的关系并衡量颜色的距离,但是在计算机中的图片主要使用 模进行图片的存储和表示,所以需要将图片的 表示模式转化为 模式,转换的公式为犎,;犌犅 ,犚 犅犌;犌犅 ,犚 犌犅;犌犅 ,犌;犌犅 ,犅烅烄烆()其中犚、犌、犅分别为该图像点的 颜色量的分值,和 为犚、犌、犅个值中的最大值和最小值为了使生成的迁移图像保持内容图像原有的色相特征,所以考虑只使用 颜色模型中的色相()维度,来平衡颜色相似度颜色损失函数的定义为犾 狀狀狀犻狀犼(犺犻,犼犺犻,犼)()其中犺犻,犼和犺犻,犼分别表示风格图像和生成图像在像素点处的色相值 总损失)内容损失假设第犾层 网络犆犾有个大小的特征图犎犾和犠犾分
10、别表示犾层特征图的高和宽犾层的响应可用矩阵表示为犉犾犚(犎犾犠犾)犆犾()内容损失通过计算内容图像在 网络第犾层的特征图和合成图像之间的欧氏距离的平方获得,即第期王希雅,等:基于注意力机制的轻量级水下图像风格迁移方法犾 (犎犾犠犾)犆犾犉犾(狔)犉犾(狔犮)()风格损失通过计算风格图像和转换图像在 网络中特征图的 矩阵的犉范数的平方得到风格损失,其计算过程如下:犾 犌犾(狔)犌犾(狔犛)犉()其中,狔为转换图像;狔犛为风格目标图像;犌犾为 矩阵,大小为犌犾犌犾)总损失本文模型的总损失犾 将内容损失、风格损失、色相损失和全变差正则化损失合并为一个线性函数,即犾 犾 (狔,狔犮)犾 (狔,狔狊)犾
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 注意力 机制 轻量级 水下 图像 风格 迁移 方法
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。