融合全局上下文注意力的遥感图像检测方法.pdf
《融合全局上下文注意力的遥感图像检测方法.pdf》由会员分享,可在线阅读,更多相关《融合全局上下文注意力的遥感图像检测方法.pdf(6页珍藏版)》请在咨信网上搜索。
1、第 卷 第 期兵 器 装 备 工 程 学 报 年 月 收稿日期:修回日期:基金项目:湖南省自然科学基金项目()湖南省教育厅开放平台创新基金资助项目()作者简介:廖欢()男硕士研究生:.通信作者:朱文球()男硕士教授硕士生导师:.:./.融合全局上下文注意力的遥感图像检测方法廖 欢朱文球雷源毅徐 轲(湖南工业大学 湖南 株洲)摘要:针对遥感图像场景复杂、目标尺寸不一、且小尺寸目标过多导致的检测精度不佳和出现漏检等问题提出了一种融合全局上下文注意力的目标检测算法 该算法提出一种全局上下文注意力机制和 中 结构融合的模块以提升网络捕捉图像全局特征的能力通过 损失函数来提升对密集、尺寸小的目标的检测性
2、能采用基于归一化的注意力模块降低图像中不太显著的特征和权重使网络能够达到更高的检测准确率利用动态卷积学习各个维度的信息让训练得到的模型在降低 情况下同时保持检测精度提升 在 数据集上实验结果 为.、准确率为.、召回率为.较原 模型分别提升了.、.和.证明了所改进 方法的有效性关键词:遥感图像 全局上下文注意力机制动态卷积本文引用格式:廖欢朱文球雷源毅等.融合全局上下文注意力的遥感图像检测方法.兵器装备工程学报():.:.():.中图分类号:.文献标识码:文章编号:()():.:引言遥感图像的目标检测技术在军用和民用领域都发挥着不可或缺的作用具有重要的应用价值 遥感图像目标检测技术旨在复杂的遥感
3、背景图像中找到需要的目标如飞机、油罐、车辆等并精确地对其进行位置定位和分类 然而由于遥感图像背景复杂度高、目标尺寸多样性高等特点使得检测的目标存在过高的误检和漏检问题 传统基于人工提取图像特征如、算法其设计复杂、效率以及泛化能力低下 近些年来深度学习在目标检测中取到了重大的进展 通过构建深度神经网络训练大量数据来学习目标的特征信息较传统的手工提取特征算法已经取得了更好的精度并且实现起来更加方便、效率更高 目前基于深度学习的目标检测算法主要分为 种类型 一类是基于候选框的两阶段目标检测算法最经典的是 提出的、和 算法其设计复杂、消耗资源多且检测速度较慢另一类是基于回归的单阶段目标检 测 算 法
4、具 有 代 表 性 的 是、和 系列方法 相较于两阶段目标检测算法单阶段目标检测算法不仅在在网络设计结构层次方面更加简单而且在检 测 精 度、速 度 方 面 也 更 优 其 中 系 列 的模型在精度和速度方法具有很高的检测能力在学术界和工业界都使用广泛综上所述本文中提出一种融合全局上下文注意力机制的遥感图像目标检测算法 在 的.版本基础上设计一种全局上下文注意力机制和 中 结构融合的模块 提升网络模型对图像全局特征的捕捉能力使用 作为模型置信度和分类损失以此提高对图像小目标的召回率采用基于归一化的注意力模块用来降低图像中不太显著的权重利用动态卷积在降低模型参数情况下提升网络模型对目标的检测精度
5、 根据网络深度和宽度的不同划分了、和 等 个 网 络 模 型 其 中 是模型容量、复杂度最小的一个 由于本实验数据集不够大因此选取 的.版本模型作为基础模型具体结构如图 所示 主干网络主要由、和 结构组成 结构主要借鉴了跨阶段网络 的思想将输入特征分为 个部分处理 主干部分通过卷积、归一化和激活函数逐步提取特征分支仅仅通过卷积层调整通道通过划分梯度信息消除了大量的梯度冗余信息 结构由卷积、归一化 和激活函数 组成用于提取模型的特征 结构将输入特征串行通过多个 的最大池化层再经由 网络结构提取堆叠的特征能够增大网络的感受野提升网络的表征能力图 网络结构示意图.模型沿用了 中自顶向下和自定向下的多
6、尺度融合方式并且引入了 结构然后将特征信息传入到检测层中 一共有 、和 等 个不同尺度的检测层用于预测大中小目标的类别和位置预测 然后通过非极大值抑制算法等后处理操作输出置信度分数最高物体的类别信息 模型改进.融合全局上下文注意力机制在目标检测领域中一般通过深度卷积神经网络去提取图像的特征信息 而深度卷积神经网络是基于其局部的像素点进行感知要想获得长距离的依赖关系一般通过多次堆叠卷积层来获取 然而直接重复堆叠卷积层使得模型计算效率低下且在长距离间会导致信息传递困难难以优化图 网络结构示意图.模块由 和 个模块组廖 欢等:融合全局上下文注意力的遥感图像检测方法成其结构示意图如图 所示 图 中 和
7、 分别表示特征图的高度和宽 表示特征图的通道数 输入图像首先通过 中 的卷积和 操作计算出注意力权重特征图然后和输入进来的 进行矩阵相乘且将每一个通道的特征层内所有值相加得到 的全局关系 然后通过 结构中 个 的卷积降低参数量此外还采用了 来减少模型优化的难题最后通过广播机制将 和 的全局信息按元素信息进行相加得到强化图像全局重要信息的输出结果为了解决长距离信息依赖问题提出一种融合全局上下文注意力机制的 模块命名为 图 即为 模块的结构示意图图 网络结构示意图.损失函数遥感图像目标检测较难的一个问题是图像中目标类别和背景类别极端不平衡其中检测目标仅仅占很少的图像区域 这会导致网络模型对检测目标
8、的学习效率降低过多地去关注背景类的特征信息 损失函数可以解决目标类与背景类数据不平衡的问题定义为()()()()()()式()中:是模型预测为目标的概率取值在 和 之间的取值为 或者 分别代表背景和或者目标 为可调节平衡因子()为目标类调节因子 为背景类调节因子 种调节因子可以提高对难检测、误检的重视程度且减少简单样本对模型损失的贡献使得 能够解决模型训练时样本数据不均衡的问题 采用平等对待正负样本的方式而在实际的目标检测中正样本对模型的贡献更为重要 因此提出一种基于 的损失函数命名为 定义为:()()()()()()式()中:是 预测值表示预测为目标类的得分 表示分类的条件对于目标类来说将其
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 融合 全局 上下文 注意力 遥感 图像 检测 方法
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。