基于改进YOLOv5的遥感小目标检测网络.pdf
《基于改进YOLOv5的遥感小目标检测网络.pdf》由会员分享,可在线阅读,更多相关《基于改进YOLOv5的遥感小目标检测网络.pdf(9页珍藏版)》请在咨信网上搜索。
1、第 49卷 第 9期2023年 9月Computer Engineering 计算机工程基于改进 YOLOv5的遥感小目标检测网络李嘉新1,2,3,侯进2,3,盛博莹1,2,3,周宇航2,3(1.西南交通大学 计算机与人工智能学院,成都 611756;2.西南交通大学 信息科学与技术学院智能感知智慧运维实验室,成都 611756;3.西南交通大学 综合交通大数据应用技术国家工程实验室,成都 611756)摘要:受遥感图像背景复杂、分辨率高、有效信息量少等因素影响,现有目标检测算法在检测小目标过程中存在错检、漏检等问题。提出基于 YOLOv5的遥感小目标检测算法 YOLOv5-RS。为有效减少图
2、像中复杂背景和负样本的干扰,构建并行混合注意力模块,采用卷积替换全连接层和移除池化层的操作来优化注意力模块生成权重特征图的过程。为获取和传递更丰富且更具判别性的小目标特征,调整下采样倍数并在模型训练过程中增加小目标信息丰富的浅层特征,同时设计卷积与多头自注意力相结合的特征提取模块,通过对局部和全局信息进行联合表征以突破普通卷积提取的局限性,从而获得更大的感受野。采用 EIoU 损失函数优化预测框与检测框的回归过程,增强小目标的定位能力。在遥感小目标数据集上进行实验以验证该算法的有效性。实验结果表明,与 YOLOv5s相比,该算法在参数量减少 20%的情况下平均检测精度提升 1.5个百分点,其中
3、,小车类目标的平均检测精度提升3.2个百分点;与 EfficientDet、YOLOx、YOLOv7相比,该算法能有效兼顾检测精度和实时性。关键词:遥感小目标检测;改进 YOLOv5;并行混合注意力;全局特征融合;损失函数开放科学(资源服务)标志码(OSID):源代码链接:https:/ J.计算机工程,2023,49(9):256-265.英文引用格式:LI J X,HOU J,SHENG B Y,et al.Remote sensing small object detection network based on improved YOLOv5 J.Computer Engineerin
4、g,2023,49(9):256-265.Remote Sensing Small Object Detection Network Based on Improved YOLOv5LI Jiaxin1,2,3,HOU Jin2,3,SHENG Boying1,2,3,ZHOU Yuhang2,3(1.School of Computing and Artificial Intelligence,Southwest Jiaotong University,Chengdu 611756,China;2.Laboratory of Intelligent Perception and Smart
5、Operation and Maintenance,School of Information Science and Technology,Southwest Jiaotong University,Chengdu 611756,China;3.National Engineering Laboratory of Integrated Transportation Big Data Application Technology,Southwest Jiaotong University,Chengdu 611756,China)【Abstract】In remote sensing imag
6、ery,the detection of small objects poses significant challenges due to factors such as complex background,high resolution,and limited effective information.Based on YOLOv5,this study proposes an advanced approach,referred to as YOLOv5-RS,to enhance small object detection in remote sensing images.The
7、 presented approach employs a parallel mixed attention module to address issues arising from complex backgrounds and negative samples.This module optimizes the generation of a weighted feature map by substituting fully connected layers with convolutions and eliminating pooling layers.To capture the
8、nuanced characteristics of small targets,the downsampling factor is tailored,and shallow features are incorporated during model training.At the same time,a unique feature extraction module combining convolution and Multi-Head Self-Attention(MHSA)is designed to overcome the limitations of ordinary co
9、nvolution extraction by jointly representing local and global information,thereby extending the models receptive field.The EIoU loss function is employed to optimize the regression process for both prediction and detection frames to enhance the localization capacity of small objects.The efficacy of
10、the proposed algorithm is verified via experiments on datasets comprising small target remote sensing images.The results show that 基金项目:国家重点研发计划(2020YFB1711902)。作者简介:李嘉新(2001),女,硕士研究生,主研方向为深度学习、目标检测;侯 进(通信作者),副教授、博士;盛博莹、周宇航,硕士研究生。收稿日期:2022-10-08 修回日期:2022-11-17 Email:图形图像处理文章编号:1000-3428(2023)09-025
11、6-09 文献标志码:A 中图分类号:TP391第 49卷 第 9期李嘉新,侯进,盛博莹,等:基于改进 YOLOv5的遥感小目标检测网络compared with YOLOv5s,the proposed algorithm has an average detection accuracy improvement of 1.5 percentage points,coupled with a 20%reduction in parameter count.Particularly,the proposed algorithms average detection accuracy of sm
12、all vehicle targets increased by 3.2 percentage points.Comparative evaluations against established methodologies such as EfficientDet,YOLOx,and YOLOv7 underscore the proposed algorithms capacity to adeptly balance the dual objectives of detection accuracy and real-time performance.【Key words】remote
13、sensing small object detection;improved YOLOv5;parallel mixed attention;global feature fusion;loss functionDOI:10.19678/j.issn.1000-3428.00659350概述 近年来,遥感图像目标检测在无人机巡检1、农业监测2、城市规划3、生态保护4等领域得到了广泛应用,因此,对遥感图像检测的进一步优化具有重要意义。遥感图像采用空中设备对地采集信息,可以解决地面采集覆盖范围有限、减少目标被遮挡等问题。但是,从远距离和俯瞰视角拍摄的目标在高分辨率下呈现多邻域聚集、小目标占比高等
14、特性,导致检测精度大幅下降,给航拍遥感场景下小目标检测带来巨大挑战。根据国际光学工程学会定义,尺寸小于原图的 0.12%可认为是小目标5。现阶段遥感领域的小目标检测性能的提升主要从多尺度融合和感受野角度出发。文献 6 对特征金字塔模块进行重构,添加跨层级横向连接以融合更多的通道特征,并在检测头前引入位置注意力(Coordinate Attention,CA)机制7以确保遥感小目标精确定位,虽然其对小目标具有较优的检测性能,但是采用直接去除顶层特征提取层的方式会对语义信息造成一定程度的损失,不利于应对复杂场景下的检测任务。文献 8 提出用于特征增强的特征图融合机制,利用卷积操作对不同深度、不同尺
15、度的特征图深度以及尺度进行统一,融合得到检测能力更强的特征图,从而构建特征金字塔(Feature Pyramid Network,FPN)以增强小目标特征。尽管在遥感飞机和不同空中飞机数据集上的检测精度均有所提升,但是其检测速度无法满足实时性需求。文 献9基 于 Faster R-CNN10上 的 特 征 金 字塔11结构设计了特征门控模块和动态融合模块,依据不同尺度分配不同权重来区分目标尺度对特征融合的影响,解决在特征融合中共享同一权重的问题。但是,基于双阶段的目标检测算法本身在速度方面存在一定的局限性。此外,研究人员从感受野角度来提升小目标检测性能。文献 12 在 8 倍下采样后的特征映射
16、中添加可变形卷积,对卷积中采样点的位置增加 1 个偏移,扩张实际感受野进而提升对小目标的识别精度,但是当目标存在背景遮挡时虚警率和漏检率较高。文献 13 参考 RFB(Receptive Field Block)14结构,采用多分支处理和空洞卷积设计特征增强模块以加强特征语义信息,减少小目标的检测精度损失,但是在遥感图像检测精度上仍有进一步提升的空间。文献 15 利用混合空洞卷积的方式提取特征,有效增 大 感 受 野,并 直 接 引 入 空 洞 空 间 金 字 塔 池 化(ASPP)16进行多尺度特征融合,以捕获更完整的卫星道路图像信息。但是以上方法使用场景单一,不能很好地应用在多场景任务中。
17、因此,现有算法在小目标检测任务上取得了一定成效,但是无法有效权衡检测精度和速度,且未考虑卷积特征提取和下采样操作过程中的小目标信息传递丢失问题。本文提出基于 YOLOv5的遥感小目标检测算法YOLOv5-RS。通过构建轻量的并行混合注意力模块抑制图像中复杂背景和负样本的干扰,同时通过调整下采样倍数,保证传递更多的细节信息,并进一步设计卷积神经网络(Convolutional Neural Network,CNN)与 Transformer17相 结 合 的 特 征 提 取 模 块C3BT,将从特征图中获取到的局部与全局信息输出作为融合的底层特征。将原网络中的 CIoU18损失函数替换为 EIo
18、U19损失函数,有效减少目标检测框的重叠,精准定位小目标的位置,从而提升模型对遥感小目标的检测性能。1YOLOv5-RS方法 近年来,目标检测领域越来越注重算法的工程化应用,对实时性要求大幅提高。考虑到一阶段网络 YOLOv5s20能兼顾检测精度与速度的特性,本文将其作为基础框架,从注意力模块、特征金字塔融合、损失函数 3个角度进行优化。在特征提取阶段,为减少小目标信息的丢失,本文使用 16倍下采样操作代替 32倍下采样,并添加浅层分支。上述操作虽然能够传递更多的浅层信息,但是缩小了感受野。基于此,本文构建具有更大感受野和更强表征能力的 C3BT 模块替换 SPPF 模块前的原 C3 特征提取
19、模块,C3BT 由 CNN 和多头自注意力(Multi-Head Self-Attention,MHSA)组合而成,同时,将并行混合注意力模块 CBAM-P 嵌入到 FPN 结构中进行 Concat 融合浅层特征之前。从模型预测中发现,在小目标的定位任务中会存在大量重复的检测框,采用 EIoU 损失 函 数 具 化 预 测 框 与 真 实 框 之 间 的 长 宽 关 系。YOLOv5-RS网络整体结构如图 1所示。2572023年 9月 15日Computer Engineering 计算机工程1.1并行混合注意力模块注意力机制的本质是仿照人类视觉处理图像的过程,对特征图的不同位置予以各自的权
20、重来表示不同的关注度。遥感图像往往包含复杂的背景,经过卷积层特征提取后存在待检测小目标信息占比少、背景以及背景中非检测物体信息占比多的情况,这些非感兴趣区域信息会对小目标检测产生干扰。为关注图像中待检测的小目标以及忽略无关的物体信息,本文借鉴了 CBAM(Convolutional Block Attention Module)21的 通 道 注 意 力 模 块(Channel Attention Module,CAM)和空间注意力模块(Spatial Attention Module,SAM)结构,提出通道注意力模块CAM-P和空间注意力模块 SAM-P,最终通过并行连接构成 CBAM-P
21、模块,使其分别沿通道和空间维度对 特 征 图 信 息 进 行 编 码。与 CBAM 模 块 相 比,CBAM-P 在 减 少 计 算 量 的 同 时 提 高 检 测 精 度。CBAM-P模块结构如图 2所示。首先对通道注意力模块进行改进,CAM-P 是基于 SENet22模块进行改进,将 SENet模块中全局平均池化(Global Average Pooling,GAP)后的全连接层替换为 33卷积层,并获取局部信息。因为小目标本身的感受野较小,所以全连接层对整张图片进行降维,导致待检测的小目标被淹没在与其他背景的平均特征之中。CAM-P特征图计算过程如式(1)所示:WC=(f1 1(f3 3
22、(GGAP(X)(1)其中:表示 Sigmoid 激活函数;f1 1表示大小为 11的卷积;f3 3表示大小为 33 的卷积。输入特征 XH W C通过 GAP 后输出 11C 的一维通道注意力图,再通过激活函数重建得到权重特征图WC。然后对空间注意力模块进行改进,SAM-P 在原SAM 模块的基础上移除所有池化层,仅由 11 卷积层生成。该操作是考虑到池化会丢失小目标的关键特征而不利于检测。SAM-P特征图的计算过程是将输入特征 X 经 111 卷积的结果输入 Sigmoid 激活函数,得到空间注意力特征图WS,如式(2)所示:WS=(f1 1(X)(2)最终,将通道特征图WC与空间特征图W
23、S分别与输入特征 X 逐元素相乘,采用逐元素相加方式将相乘后所得的特征图并行连接,输出特征XCS。上述过程的计算式如式(3)所示:XCS=X WCXWS(3)其中:表示逐元素相乘;表示逐元素相加。1.2特征金字塔改进特征金字塔网络结构如图 3 所示。YOLOv5 特征 图 的 融 合 部 分 采 用 路 径 聚 合 网 络(Path 图 1YOLOv5-RS网络整体架构Fig.1Overall architecture of YOLOv5-RS network图 2CBAM-P模块结构Fig.2Structure of CBAM-P module258第 49卷 第 9期李嘉新,侯进,盛博莹,
24、等:基于改进 YOLOv5的遥感小目标检测网络Aggregation Network,PANet)23,其结构如图 3(a)所示。将主干网络经 8 倍、16 倍、32 倍下采样后输出P3,P4,P5 特征,分别与 FPN 自底向上的特征图进行融合。这种将浅层丰富细节信息和深层高语义信息融合的操作有利于多尺度目标检测,但是对于小目标,经过多次下采样后特征图所含小目标的有效特征信息较少,导致小目标检测精度降低。因此,本文对特征金字塔进行改进,保证传递更多的小目标细节信息并输出对小目标表征能力更强的特征图。改进后的特征金字塔PANet_RS结构如图3(b)所示。原始输入图像在经卷积下采样逐步映射为不
25、同尺度特征图的过程中,所包含的有效像素信息逐渐减少。表1所示为将原始图像映射到不同特征层后所占像素的情况,P2、P3、P4、P5分别进行 4、8、16、32倍下采样。结合实际数据目标尺度分布情况,将小目标进一步划分为检测尺度小于1616像素的微小目标。从表 1 可以看出,小目标特征映射到 P5 特征层后所包含的小目标分辨率为 11 像素,微小目标的分辨率甚至不到 11 像素,对遥感小目标的检测效果甚微。考虑到直接裁剪 P5 检测层和其对应的分支,会造成深层网络间的语义信息缺失、感受野减小,进而影响分类任务的准确率。为缓解语义信息与位置信息之间的矛盾,本文在主干网络中去除32 倍的下采样层,使用
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 改进 YOLOv5 遥感 目标 检测 网络
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。