基于DCF-DeepLab网络的图像语义分割研究.pdf
《基于DCF-DeepLab网络的图像语义分割研究.pdf》由会员分享,可在线阅读,更多相关《基于DCF-DeepLab网络的图像语义分割研究.pdf(9页珍藏版)》请在咨信网上搜索。
1、第 卷 第 期 智 能 计 算 机 与 应 用 年 月 文章编号:()中图分类号:文献标志码:基于 网络的图像语义分割研究蔡江海,黄成泉,杨贵燕,罗森艳,王顺霞,周丽华(贵州民族大学 数据科学与信息工程学院,贵阳;贵州民族大学 工程技术人才实践训练中心,贵阳)摘 要:针对 中存在的图像小目标信息易丢失、训练时效长、目标边界分割粗糙等问题,提出了一种基于双注意力交叉融合的 图像语义分割网络。该网络设计了基于注意力机制的特征融合模块,分别在、倍下采样特征图上使用该模块,融合浅层特征以弥补深层特征的不足;在主干特征提取网络部分引入轻量级网络,减少模型推理时间;在 模块嵌入多个注意力模块和串联结构,增
2、强网络细节特征提取能力。通过在 数据集上的实验结果表明,该网络可有效提升图像语义分割性能,具有一定应用潜力。关键词:;特征融合;注意力机制;语义分割 ,(,;,)【】,(),【】;?哈尔滨工业大学主办学术研究与应用基金项目:国家自然科学基金();贵州省省级科技计划项目(黔科合基础一般);贵州省研究生教育教学改革重点项目(黔教合);贵州省教育厅自然科学研究项目(黔教技)。作者简介:蔡江海(),男,硕士研究生,主要研究方向:统计建模与模式识别;黄成泉(),男,博士,教授,硕士生导师,主要研究方向:计算机应用技术、图像处理;杨贵燕(),女,硕士研究生,主要研究方向:统计建模与模式识别;罗森艳(),女
3、,硕士研究生,主要研究方向:统计建模与模式识别;王顺霞(),女,硕士研究生,主要研究方向:统计建模与模式识别;周丽华(),女,硕士,副教授,主要研究方向:图像处理、模式识别。收稿日期:引 言随着计算机视觉技术的飞速发展,图像语义分割已成为该领域研究的热点之一。基于深度学习的语义分割方法相较于传统图像处理方法,性能得到了极大的提升,被广泛应用于自动驾驶、医学图像处理、人脸识别等领域。等提出的全卷积网络()是一种端到端的语义分割网络,可以有效应用于图像语义分割研究。然而,连续的池化和下采样操作容易引起浅层语义信息丢失,进而导致小目标信息丢失和边界分割模糊。等提出了 语义分割模型,该模型引入编码器解
4、码器结构,利用上采样和下采样过程进行跳跃连接,实现了更高精确的分割。等提出了引入空间注意力和通道注意力的分割网络,有效提升了模型的性能。后续,相关研究者又陆续提出了更好的兼 顾 精 度 和 速 度 的 图 像 语 义 分 割 模 型,如、等。等在 基础上提出了,并引入 ()模块实现多尺度的特征提取。之 后 又 相 继 提 出 了 基 于 模 块 的 和采用编码器解码器结构的,实现了更好的图像语义分割。到目前为止,系列都是在降采样 倍尺度上进行预测的,边界分割效果不甚理 想。网络并没有包含过多的浅层特征,不仅在语义信息和位置信息的平衡上存在连续池化和下采样导致的小目标信息丢失的问题,并且由于该网
5、络是通过多层卷积叠加而成的,存在训练时效长、目标边界分割粗糙等问题。为此,等通过注意力式可分离卷积的编码器解码器结构,在多尺度特征上有效均衡了训练效率和分割精度。等利用基于注意力机制的优势,较好地克服了因下采样导致的浅层细节信息丢失的问题,但模型参数量大,训练时效长,实用性较低。针对以上问题,本文提出了融合多模块的()语义分割网络。首先,设计了基于双注意力交叉融合的 特 征 融 合 ()模块,以融合浅层特征弥补深层特征的不足,并将其应用于主干特征提取网络的、倍下采样的特征图上,充分提取小目标特征信息,实现特征图跨模块的融合;其次,在主干特征提取部分引入轻量级网络,加速整体网络的训练速率;最后,
6、通过嵌入 模块、注意力模块和串联结构得到()模块,实现多尺度信息编码,增强图像目标边缘的细节特征提取能力。语义分割网络从整体上精细了语义分割结果,提升了语义分割性能。网络 网络 网络主要由两部分组成:()在编码端使用 残差网络模型作为基本特征提取的主干网络,得到有效特征图,再利用 模块(由 个 卷积、个全局池化层以及 个不同空洞率的空洞卷积共同组成)进一步提取特征得到多尺度特征图;()在解码端将多尺度特征图进行拼接和 的卷积操作得到特征图(该特征图与基本特征提取主干网络下采样得到的特征图的通道数相同),最后通过上采样,将所得特征图还原回与原始图像大小相同的尺寸,得到语义分割的结果。整体结构如图
7、 所示。A S P P 模块1?1 卷积3?3 卷积空洞率:63?3 卷积空洞率:1 23?3 卷积空洞率:1 8全局池化多尺度特征图1?1卷积上采样预测图像输入图像特征提取图 整体结构 网络为了使 网络高效地训练出预期的结果,提升网络训练参数的速度,解决因训练时间过长可能导致目标分割结果不佳的问题。本文采用具有高效且网络参数量、运算量小的 作为本文网络在编码端的主干特征提取网络。网络结构见表。表 网络结构 ,在 网络结构中,“”表示输入当前层特征矩阵的尺寸;“”表示输入特征矩阵在本层中进行的操作,主要由普通二维卷智 能 计 算 机 与 应 用 第 卷积操作、多个倒残差模块()操作以及池化操作
8、组成,其中“”表示不包含 层;“”表示利用 的卷积核扩展后的通道数;“”表示输出特征矩阵的通道数,其中 表示类别数量;“”表示通道注意力机制;“”表示激活函数,其中“”为 激活函数、“”为 激活函数;“”表示步距。注意力模块在计算机视觉领域,通道注意力机制被广泛应用于各类研究。()模块针对不同语义信息的属性特征,在通道上实现了更好的信息获取和分割效果。模块结构如图 所示。全局平均池化空间特征压缩 通道注意力信息通道特征学习卷积激励操作图 模块结构 在全局平均池化中将全局空间信息转换成通道统计信息,并执行压缩操作得到空间特征压缩量。假设输入特征统计量 ,其中特征通道量 ,输出特征统计量经过全局平
9、均池化得到,其中第 个元素值为()(,)()为了利用压缩操作中聚合的信息,完全捕获依赖通道的信息,执行激活操作。实现上,通过引入全连接层对输出特征统计量 进行通道依赖关系编码,学习通道之间的非线性交互作用,并结 合 函数进行通道赋权,获取通道注意力信息。最后,将得到的权重系数应用于输入特征中,得到通道注意力的输出 其计算关系为()()其中,()为 激活函数,为全连接层参数。()模块分别在通道和空间维度上进行注意力操作,以获得全面的注意力信息,引导模型进行权重分配和信息指引。模块结构如图 所示。图 模块结构 假设 表示输入的特征图,表示一维的通道注意力,表示二维的空间注意力。经过 模块依次推导出
10、通道注意力和空间注意力的映射,计算过程如下:()()()()式()中,将原始特征图 与其经过通道注意力模块操作后的结果进行元素相乘得到;式()中,将输出 与经过空间注意力模块做特征提取后的结果进行元素相乘,得到最终的输出结果。为了提高通道注意力模块中网络的表征能力,首先,对输入的特征进行最大池化操作()和平均池化操作()聚合特征图的空间信息;其次,将池化后的特征信息输入到共享全连接层中以生成通道注意力图,其中共享全连接层由具有隐藏层的多层感知器()组成,并将输出的特征进行相加融合;最后,利用 函数进行激活操作,得到输入特征层中每一个通道的权重值。通道注意力模块结构如图 所示。共享全连接层图 通
11、道注意力模块结构 假设 表示输入的特征图,其经过通道注意力模块的计算过程为()()()()()()式中:()表示 激活函数,表示全连接层,其中 为缩减比率,、分别表示最大池化特征和平均池化特征,权重、对于两个输入都是共享的。在空间注意力模块中,为了计算空间关注度并聚合空间特征信息,在通道轴上应用平均池化操作和最大池化操作,并将其连接起来生成有效的特第 期蔡江海,等:基于 网络的图像语义分割研究征描述,再利用通道数为 的卷积核进行降维,最后利用 函数进行激活操作,获得输入特征层的每一个特征点的权重值。空间注意力模块结构如图 所示。降维最大池化平均池化输出每个特征点权值图 空间注意力模块结构 空间
12、注意力模块的计算过程为()();()(;)()式中:()表示 激活函数,表示滤波器的卷积运算,、分别表示最大池化特征和平均池化特征。模块 模块给每个特征通道上的信号都赋予了一定的权重,对特征通道上的背景信息和前景目标信息有了更明确的选择,强化了感兴趣的特征,增强了特征通道下特定语义的响应能力。模块在通道和空间维度上对不同位置元素间的关系进行建模,其兼顾通道注意力和空间注意力的优势,获得更可靠的权重信息,增强了模型的表征能力。计算机视觉领域常用的特征融合方式,是在同一张特征图上分别进行两种注意力机制操作,并进行结果的融合,其主要不同之处在于特征融合方式。考虑到语义分割任务中对图像分辨率的影响,通
13、常情况下,分辨率低的深层特征图采取通道注意力操作,其关注点放在相关的特征通道上;分辨率高的浅层特征图采取空间注意力操作,提取特征图中关于空间位置的关键信息。因此,本文综合注意力机制对不同分辨率的深浅层特征图提取特征的优势,通过嵌入 和 模块,得到有效融合浅层空间细节信息和深层高级语义线索的 模块,如图 所示。假设:在 模块中,输入的低分辨率深层特征图为,尺寸大小为 ;高分辨率浅层特征图的输入为,尺寸大小为 。首先,根据公式(),将 进行上采样操作得到 使得尺寸大小与 相同,均为 。()()式中:()表示采用双线性插值方法的上采样操作,其次,对 进行 注意力操作,得到。并根据公式(),对 通过
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 DCF DeepLab 网络 图像 语义 分割 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。