基于Transformer的航空目标检测算法.pdf
《基于Transformer的航空目标检测算法.pdf》由会员分享,可在线阅读,更多相关《基于Transformer的航空目标检测算法.pdf(9页珍藏版)》请在咨信网上搜索。
1、 年 无线电工程 第 卷 第 期:引用格式:季长清,高志勇,秦静,等基于的航空目标检测算法无线电工程,():,():基于的航空目标检测算法季长清,高志勇,秦静,汪祖民(大连大学 物理科学与技术学院,辽宁 大连;大连大学 信息工程学院,辽宁 大连;大连大学 软件工程学院,辽宁 大连)摘要:近几年,基于深度学习的目标检测算法在航空图像检测任务中得到了广泛应用。针对传统水平目标检测算法无法定位航空图像中大量密集排列的倾斜目标问题,提出了模型算法来实现航空图像中倾斜目标的检测任务。为了避免深度卷积神经网络(,)带来的网络退化等问题,使用结构搭建特征提取网络;针对密集的、小尺度图像目标的问题,采用多尺度
2、特征融合的方法提升检测效果;针对倾斜目标检测的问题,通过边界框边缘感知向量表示任意角度的倾斜目标。在 和数据集上的部分测试结果表明,此方法的平均精度分别为 和,证明了模型算法的有效性。关键词:深度学习;倾斜目标;航空检测;中图分类号:文献标志码:开放科学(资源服务)标识码():文 章 编 号:(),(,;,;,):,(),;,;,:;收稿日期:基金项目:国家自然科学基金青年科学基金项目():()引言随着近些年航空技术和无人机巡航技术的快速发展,航空图像中的目标检测任务作为航空领域中最具挑战的任务之一,吸引了诸多目标检测领域研究者的关注,随着航空影像数据质量的提升,图像数据的检测面临着以下个问题
3、:图像的空间分辨率不断提高,图像中的目标数据也越来越多,图像场景结构越来越复杂,密集检测较为困难;图像中不同比例尺度的目标样本具有不同的纹理特征,信号与信息处理 且待检测目标通常以任意方向显示。本文的研究内容将沿着上述个问题展开。伴随着深度学习技术的不断发展,可以将基于卷积神经网络(,)的目标检测算法大致分为类:端到端的一阶段检测方法和二阶段检测方法。二阶段检测方法需要预先生成区域建议框,然后再对区域建议框进行后处理,最后进行回归和分类,该类方法得到的目标准确度较高,但识别速度相对较低,比如、等。不同于二阶段检测方法,一阶段检测方法无需生成区域建议框,而是直接使用对图像数据进行处理,在提取的特
4、征图上回归检测结果。比如系列算法等,但该类算法对小目标检测并不友好,在处理密集的目标时,产生的最后结果通常会覆盖过多的图像背景或相邻的目标区域。以上目标检测算法模型在训练过程中均使用水平框标注的形式,如分别标注目标左上角、右下角的坐标或者标注水平目标框的中心点坐标并同时记录水平目标框的宽度和高度,因此在实现模型推理时无法有效地解决航空旋转目标角度偏移的问题。受益于自然语言处理的发展,该领域中的结构被用于解决计算机视觉任务。年谷歌提出了 模型,它在的测试集上取得了 的准确率,刷新了该榜单上的纪录,该模型避免了深度卷积神经网络带来的网络退化等问题。由于现有的航空图像分辨率较高、像素点多,因此 模型
5、基于全局自注意力的特征提取方式带来了大量的计算,非常耗费计算资源。随后出现的 模型很好地缓解了以上问题,该模型的主要思想是将具有很强建模能力的结构和重要的视觉信号先验知识结合起来,构筑了具有层级结构的主干网络,这使得 在特征提取的任务中达到了较好的效果,表明了结构在计算机视觉领域中具有独特的优势。模型首先把方法应用到目标检测领域,但没能解决航空图像中旋转目标检测的问题。模型在的基础上改良了收敛缓慢以及二分图分配不稳定的问题,但仍不能实现旋转目标的检测。结合以上问题及结构的启发,本文从端到端检测的思路出发并结合 的检测方式设计了一个基于的一阶段旋转目标检测器,主要工作是:使用了全局注意力机制的结
6、构搭建特征提取网络,避免了过深卷积层带来的网络退化问题;使用了多层特征融合的思路去获得最终的特征图,充分利用了浅层与深层的特征;使用回归的方式直接得出了目标的旋转角度。模型 模型的整体结构由构建的目标检测模型存在着一些问题,比如随着卷积层数量的增加,特征图上单个位置对应的局部感受野会随之扩大,过大的局部感受野不利于小尺寸目标的检测;堆叠过多的卷积层无法更好地提取特征,网络模型存在退化问题等。所以本文提出了基于结构的旋转目标检测网络,称为,模型如图所示,主要包括由结构组成的主干特征提取网络和预测模块个部分。对于主干特征网络,本文使用层级式的设计方式,结合 模块并采用 的比例构建主干特征提取网络。
7、在预测模块中,分别预测目标的热力图()、中心点偏移量()、边界框类型()和边界框参数()。为了更好地使用到浅层特征的位置细节信息,在模型构建时使用了多特征层融合的策略,分别使用了 模块的输出特征,与通过双线性插值实现上采样的特征图进行融合,用以实现更精确的目标检测。信号与信息处理 年 无线电工程 第 卷 第 期 图模型 主干特征提取网络使用改进后的 模型充当特征提取的主干网络。最重要的改进表现在 层,改进后的模型获取了每一次下采样产生的一维特征向量,并且新的 层根据实验设置的批量大小将一维特征向量重新分解成二维平面图像,这样做可以达到类似逐层扩大感受野的效果,便于在此基础上更好地把握图像的多尺
8、度特征生成新的特征图。由于航空图像的分辨率非常高,所以在设计模型时使用了窗口多头自注意力机制(,)的方式将图像划分成多个不相交的区域,使得全局性的多头自注意力机制只在每个独立的区域内进行。这样的计算方式利用了局部性的先验知识,即同一个物体的不同部位或是语义相近的不同物体在图像上大概率会出现在相连的地方。所以即使是在独立的小区域内做自注意力计算,也足以满足视觉任务的需要。相对于中直接对整个特征图进行多头自注意力机制的方式,使用的方式在提取特征时能够大大减少计算量,尤其是在浅层存在较大特征图的时候。但由于隔绝了不同区域之间的信息传递,使得失去了全局建模的能力,所以模型构建时也使用了窗口转移多头自注
9、意力机制(,)的方式,这种特征提取的方式能够让信息在相邻的区域中进行传递。使用这种模块组合构建的 单元可以让模型在进行特征的提取时不仅能关注到图像中的每一个像素点,还能降低计算的复杂程度。这种全局性的注意力机制让模型能够很好地处理密集、小目标的问题,可以较好地提取图像中的目标信息。特征融合策略由于高分辨率航空图像中的目标尺度变化范围较大,比如较大尺度的飞机和较小尺度的船舶。如果直接使用主干网络提取的特征图,并在同一特征图下对不同尺度的目标进行兴趣区域的目标特征提取时会造成较大的目标损失。融合不同尺度的特征是提高检测性能的一个重要手段,本文模型也像、和系列算法一样使用了特征融合的方式去构建。如图
10、所示,通过残差连接的方式,将双线性插值上采样得到的深层特征和浅层特征结合起来。这样做既保留了图像的浅层位置细节信息又使用了高层特征图的语义特征,避免了仅使用最后低分辨率特征图带来的几何信息表征能力弱、缺乏空间几何特征细节的缺点。此时模型可以进一步处理通过该策略得到的特征图来解决倾斜目标的问题。在实验部分,本文对此特征融合策略做出了相应的论证。特征融合的方式如图所示。信号与信息处理 图特征融合的方式 预测模块模型的预测模块用来处理目标的倾斜问题。热力图用来检测航空图像中倾斜目标的中心点,特征图的通道数对应类别数,每个通道的映射通过一个函数传递。特定中心点的预测热力图值被视为物体检测的置信度。训练
11、热力图时,为了减少高斯凸起内部点的损失和避免该项损失函数带来的梯度爆炸问题,此次实验使用了新的损失函数来训练这个热力图:()(),()(),()式中:和 为地面实况和预测的热力图值,为特征图上的像素位置,为在热力图某点处恰是某类别的中心点,为一个极小的正数,为对象的数量,和为控制每个点的贡献的超参数。改进后的损失函数不同于。由于在热力图中选取的中心点坐标都为整数,从输入图像到输出热力图按比例缩小一个像素点坐标时会生成一个浮点数,将特征图上的点映射回原输入图像时会造成较大的精度误差,所以通过预测偏移图补偿量化浮动中心点和整数中心点之间的差异。需要预测的偏移量表示为:,(),()式中:、分别为下采
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 Transformer 航空 目标 检测 算法
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。