单级感受野增强的红外多尺度目标检测网络_郑璐.pdf
《单级感受野增强的红外多尺度目标检测网络_郑璐.pdf》由会员分享,可在线阅读,更多相关《单级感受野增强的红外多尺度目标检测网络_郑璐.pdf(6页珍藏版)》请在咨信网上搜索。
1、引用格式:郑璐,周彤彤,叶泽聪,等单级感受野增强的红外多尺度目标检测网络电光与控制,():,():单级感受野增强的红外多尺度目标检测网络郑 璐,周彤彤,叶泽聪,彭月平(武警工程大学,研究生大队;信息工程学院,西安)摘要:针对红外多尺度目标检测,提出了一种轻量级的基于单级感受野增强的检测网络。检测网络采用简化的 作为骨干网络,结合空洞卷积和空间注意力机制,设计了单级感受野增强模块,使单级特征图感受野范围得到扩大,相邻像素点间的相关性得到增强。为提高模型反向传播效率、均衡正负样本,采用自适应训练样本选择方法,最终得到模型大小仅 ,浮点运算量仅 的轻量级检测算法。在构建的 数据集上 达到 ,在 显卡
2、上 达到 帧。关键词:目标检测;多尺度;单级感受野增强;轻量级算法中图分类号:文献标志码:,(,;,):,:;引言目前,随着计算机硬件的发展以及红外数据集的扩充,越来越多的基于深度学习的红外目标检测算法问世。与基于手工固定滑动窗口、步长和固定超参数的传统检测方法相比,基于深度卷积神经网络的方法凭借强大的特征提取和学习能力,能够从复杂图像中提取特征并进行分层表示。这些特性使得设计基于深度卷积神经网络的目标检测算法成为当前复杂背景下红外目标检测的有效突破口。收稿日期:修回日期:基金项目:军队装备综合研究项目();科研单位自主选题研究项目()作者简介:郑 璐(),女,浙江金华人,硕士生。随着深度学习
3、技术的兴起,基于 的红外目标检测方法通过数据驱动的方式学习目标特征,引起了广泛关注。文献率先将基于深度学习的目标检测算法应用于红外目标检测,但由于图像尺寸小、只有灰度信息、特征不明显,机器视觉领域现有的基于深度学习的目标检测算法不用于检测存在大量小目标的红外场景。为解决小目标虚警率高的问题,文献通过对高、低分辨率层的调整,重新设计了 网络结构;文献采用自适应感受野融合模块,增加小目标周围的上下文信息,并引入空间注意力机制来优化网络;文献指出,有效的小锚点和浅层特征是小目标检测的关键;为解决红外目标淹没在背景杂波中时虚警率高、检测率低的问题,文献利用卷积神经网络巧妙地将检测问题转化为模式分类问题
4、,提出了一种 第 卷 第 期 年 月 电 光 与 控 制 郑 璐等:单级感受野增强的红外多尺度目标检测网络天空复杂云背景下红外小目标检测算法;文献利用回归型的深度卷积神经网络进行背景成分抑制,通过阈值分割提取出候选目标区域;在轻量化网络设计方面,文献尝试平衡无人机检测的精度和速度,设计了基于深度卷积神经网络的红外无人机监控快速探测器;文献以目标中心点作为目标检测关键点,采用轻量化的特征提取网络,提出了一种基于关键点的快速红外目标检测方法。本文从降低模型复杂度、强化红外特征、提高多尺度目标检测性能 个角度出发,提出一种基于单级感受野增强的红外多尺度目标检测网络。在特征提取阶段,采用简化的 网络,
5、仅提取 倍下采样特征图;在特征融合阶段,利用单级感受野增强模块扩大特征图感受野覆盖范围,同时强化不同区域间的相关性;在检测阶段,采用自适应样本选择的方法。在制作的 数据集上进行实验,实验结果表明,该红外多尺度目标检测网络具有较好的检测效果。单级感受野增强的红外多尺度目标检测网络 简化的 骨干网络为尽可能地减少模型运算量,提高算法检测速度,改善 特征提取网络带来大量参数的问题,节省计算资源,本文使用 骨干网络进行优化。是 等于 年在 的基础上提出的改进版本,是目前轻量级神经网络中最具代表性的网络之一,其主要思想是采用深度可分离卷积来减少运算量及参数量。的核心模块是具有线性激活的倒残差结构。普通的
6、残差结构先通过 卷积进行降维,减少通道数,再用 卷积核进行卷积处理,最后通过 卷积扩充通道数实现升维。对于倒残差结构,首先在 深度卷积之前使用 卷积和 激活函数,对通道数进行扩张,使网络能够获得更多特征,并在 卷积进行通道降维后,用 激活函数代替非线性的 激活函数,防止滤除有用信息对特征造成破坏。在 中通常采用,倍下采样特征图对多尺度目标进行检测,而本文算法中仅选取单级特征图作为后续感受野增强模块的输入,采用浅层特征图能够保留更多的细节信息。因此,使用 作为骨干网络,选用 倍下采样特征可以更充分地保留目标位置信息,保证了小目标的检测能力。单级感受野增强模块设计 设计思路考虑到多层特征的融合网络
7、不可避免地会使检测器变得复杂,带来内存负担,并降低检测器的速度,考虑能否用单级特征图完成多尺度目标检测任务。文献指出特征金字塔()的一大优势在于能够依据目标的不同尺度在不同级别的特征图上检测目标,对于单个特征图而言,特征感受野匹配的尺度范围限制了算法对检测目标的尺度,因此考虑能否找到一种使单级特征图感受野得到增强的优化方法,同时保证算法模型的简单、准确和快速。设计原理在红外多尺度目标图像中,由于目标尺度变化范围大,采用不同感受野的多级特征图对不同尺度目标进行检测。单一特征图的固定感受野只能匹配一定范围内的部分目标,当目标尺度和感受野不匹配时,检测效果会很差。受文献的启发,空洞卷积可以在不丢失分
8、辨率的情况下扩大感受野,让每个卷积输出都包含较大范围的信息。但由于空洞卷积的稀疏性,远距离卷积得到的信息之间通常没有相关性,容易造成局部信息丢失,对中小目标的检测很不友好。将感受野扩张前后特征图各通道上的像素分别进行相加,能够更好地克服这一问题。以空洞率为 的空洞卷积为例,图()、图()分别表示有、无扩张感受野融合的 感受野示意图。图 感受野示意图 由图 可见,扩张感受野融合后的特征 具备原输入的像素信息和更大范围内的感受野信息,相邻像素点间的相关性得到增强,有效缓解了空洞卷积棋盘效应造成的局部信息丢失。单级感受野增强模块基于上述设计思路和原理,设计的单级感受野增强模块主要由扩张感受野融合和自
9、适应滤波两个部分组成,如图 所示。图 感受野增强模块 第 期 首先,在扩张感受野融合阶段,把特征提取网络的输出特征 输入到 卷积经过维度变换,经过 空洞卷积扩大感受野,再经过 卷积恢复输入维度得到特征。特征通过膨胀卷积,覆盖尺度范围得到一定程度的扩大,相当于原来覆盖的尺度乘上一个大于 的因子,发生了偏移和扩大,仍然不能覆盖所有的目标尺度。所以对 和 各通道上像素值进行相加,使原始尺度范围和放大的尺度范围通过添加相应的特征相结合,得到一个包含多个接收域的输出特征,覆盖所有的目标尺度。随后,进入自适应滤波阶段,经过一个通道数为 的 卷积,将 的三维特征压缩为 的平面,再用 函数激活,将其像素值调整
10、到 范围内。此时 可以看作一个既包含扩张感受野信息,又整合了各个通道间信息的强大滤波器,将输入特征 通过滤波器,得到基于感受野增强的输出特征。基于单级感受野增强的红外多尺度目标检测网络设计在完成 轻量级骨干网优化以及单级感受野增强模块设计的基础上,提出基于单级感受野增强的红外多尺度目标检测算法,用于红外多尺度无人机目标的检测,其网络结构如图 所示。图 红外多尺度目标检测网络结构图 算法以优化的 网络进行特征提取,仅使用原来 的前 层,即 个 和前 组。数据集中输入图片大小为,特征提取阶段输出为 的 倍下采样特征图。在进入单级感受野增强模块之前先通过 卷积完成上下文语义信息的细化。然后串联 个扩
11、张率分别为,的感受野增强模块,赋予特征图不同大小的感受野,从而增加了特征感受野匹配的尺度范围,使网络能够捕获多尺度上下文信息,具备多尺度目标检测的能力。在目标预测阶段,单级特征图上稀疏的 生成策略造成正样本不均衡,导致训练中存在大量简单负样本产生的梯度回传,影响困难样本分类的准确性。在参考 和 正样本确定方法的基础上,采用一种自适应训练样本选择方法,如图 所示。图 样本选择方式示意图 如图 所示,通过计算先验框与标注框之间的,并与设定的阈值进行比较来确定正样本,如果大于设定的正样本阈值,则视为正样本;如果小于负样本阈值,则视为负样本,其余为忽略样本。将特征图位置映射回原图进行比对,即特征图中心
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 感受 增强 红外 尺度 目标 检测 网络 郑璐
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。