分销赏收藏举报申诉 / 9

立即下载开通VIP

当前位置：首页 > 学术论文 > 论文指导/设计 > 利用注意力机制融合的YOLOv5遥感图像目标检测.pdf

利用注意力机制融合的YOLOv5遥感图像目标检测.pdf

上传人：自信****多点

文档编号：649098

上传时间：2024-01-23

格式：PDF

页数：9

大小：6.29MB

《利用注意力机制融合的YOLOv5遥感图像目标检测.pdf》由会员分享，可在线阅读，更多相关《利用注意力机制融合的YOLOv5遥感图像目标检测.pdf（9页珍藏版）》请在咨信网上搜索。

1、Aug.2023Journal of InformationEngineeringUniversity2023年8 月Vol.24 No.4第2 4卷第4期信息工程大学学报D0I:10.3969/j.issn.1671-0673.2023.04.008利用注意力机制融合的YOLOv5遥感图像目标检测王龙博，刘建辉，张贝贝，魏祥坡（信息工程大学，河南郑州450 0 0 1）摘要：遥感图像目检测与识别是近年来国内外研究的热点之一。针对检测任务中因目标密集分布、目标尺度不一所导致的精度不高等问题，提出了一种改进YOLOv5的融合注意力机制目标检测算法。首先，将坐标注意力机制（Coordinate A

2、ttention，CA）分别融合到YOLOv5的骨干网络、颈部和输出端3个位置，以提高模型的特征提取能力。其次，进行训练和测试，实验结果表明，骨干网络位置最适合融合注意力，能够有效增强模型的检测性能。再次，采用CIoU_loss作为损失函数，以改善目标检测框的定位精度。最后，进行消融、对比实验，结果表明，提出的改进算法相较于原始YOLOv5算法具有更好的检测性能，mAP50提高了2.9 个百分点，有效提高了遥感图像的目标检测精度。关键词：目标检测；YOLOv5；注意力机制；遥感图像中图分类号：TP391.4文献标识码：A文章编号：16 7 1-0 6 7 3(2 0 2 3)0 4-0 438

3、-0 9Object Detection in YOLOv5 Remote Sensing ImageUsing Attention Mechanism FusionWANG Longbo,LIU Jianhui,ZHANG Beibei,WEI Xiangpo(Information Engineering University,Zhengzhou 450001,China)Abstract:Object detection and recognition of remote sensing images is a hot topic in recent years.Toaddress th

4、e low accuracy caused by dense distribution and different scales of targets in detectiontasks,an improved YOLOv5 fusion attention mechanism target detection algorithm is proposed.First,CA attention mechanism is integrated into the backbone network,neck and output of YOLOv5respectively to improve the

5、 feature extraction ability of the model.Second,training and testing arecarried out.The experimental results show that the backbone network location is most suitable for at-tention fusion and can effectively enhance the detection performance of the model.Third,CloU_Loss is used as a loss function to

6、 improve the positioning accuracy of the target detection frame.Fi-nally,ablation and contrast experiments are carried out.The results show that the improved algo-rithm proposed in this paper has better detection performance than the original YOLOv5 algorithm.The mAP50 is improved by 2.9 percentage

7、point,which effectively improves the target detection ac-curacy of remote sensing images.Key words:target detection;YOLOv5;attention mechanism;remote sensing image目标检测是获取军事情报信息的重要技术手段之一，利用目标检测技术对遥感图像进行目标的检测与识别已成为当前研究热点。随着我国空间科学技术的快速发展，尤其是资源、高分系列卫星收稿日期：2 0 2 2-11-2 5；修回日期：2 0 2 2-12-12基金项目：河南省自然科学基金资

8、助项目（2 2 2 30 0 42 0 38 6）作者简介：王龙博（2 0 0 1-），男，学士，主要研究方向为目标智能处理。王龙博，等：利用注意力机制融合的YOLOv5遥感图像目标检测439第4期相继升空，获取的遥感图像呈现指数级增长，并逐渐成为目标检测的重要数据来源。不同于现有的自然场景图像，遥感图像往往具有成像目标相互遮挡、分布密集、背景复杂等特点，导致模型检测的速度与精度降低，给目标检测任务带来了较大的难度和挑战。同时由于成像距离较远，待检测目标通常在遥感图像中呈现出较小的占比；而且同一遥感图像往往含有不同尺度的目标。因此，如何利用目标检测技术对海量遥感图像数据实现高效且精确的目标识别

9、，对军事情报研究具有重要意义。在海量数据的挑战之下，同时满足目标检测准确性和时效性的难度越来越大。传统的遥感图像目标检测算法依赖人工，存在检测实时性不高以及检测精度较低等问题,难以满足实际应用需求。因此，随着深度学习技术的深人研究，目标检测技术已经从依赖大量人工的常规技术,逐步与深度学习技术相结合。从算法处理的流程来看,基于深度学习的目标检测算法主要包括两类：两阶段和单阶段检测算法。前者先建立待检测区域，然后再对目标进行检测判断，因此算法检测精度较高，适用于高精度检测等场景，但算法模型参数过多且构建过程复杂，导致算法时效性较差。典型算法有区域卷积神经网络（Regin based Convolu

10、tional Neural Net-work,R-CNN）【1)、快速区域卷积神经网络（Fast Re-gion based Convolutional Neural Network,Fast R-CNN）2 和更快速区域卷积神经网络（FasterRe-gion based Convolutional Neural Network,Faster R-CNN）3 等。单阶段目标检测算法一步完成待检测区域的生成、分类与回归,因而算法实时性高，适用于实时目标检测等场景，代表算法有单次多边框检测算法(Single Shot MultiBox Detector,SSD）4 和阶段目标检测算法（YouOn

11、lyLookOnce，YO LO）等。YOLOv15作为YOLO系列算法的开创之作，采用网格划分的方法减少了大量重复操作，从而实现了检测速度的大幅提升。YOLOv26的提出解决了YOLOv1在召回效率和定位精度方面的缺陷。YOLOv37在YOLOv2算法的基础上，使用了更为完善的骨干网络以及多尺度特征融合结构，用来提高检测精度与速度。YOLOv48采用CSPDarknet53作为骨干网络，利用空间金字塔池化（FeaturePyra-midNetwork,FPN)以及路径聚合网络(PathAggre-gation Network,PAN）进行特征融合，达到了更高的检测性能。YOLOv5借鉴了YO

12、LOv4的设计方法，采用更加轻量化的网络设计、自适应锚定方法和GIoU损失函数进行优化，是目前比较完善的单阶段检测算法,兼顾检测效率以及准确性。但在现有的检测任务中,该算法仍然面临许多问题。例如，由于遥感图像目标背景复杂、尺度不一、相互遮挡等问题的存在,大大增加了检测任务的难度,导致算法检测精度受限，因此许多学者对YOLOv5算法进行了改进。例如,文献 9 提出了一种轻量化的改进模型YOLO-G,通过改进YOLOv5的特征金字塔结构，将并行模式的注意力机制融人骨干网络，提高了模型的检测性能。文献 10 使用DenseBlock模块替换YOLOv5骨干网络中的切片结构，并在颈部增加了SE-Net

13、通道注意力模块，提高了算法对于目标密集分布场景下的检测能力。文献 11 提出了一种改进的YOLOv5算法，通过在骨干网络中融合坐标注意力机制，结合加权双向特征金字塔（Bi-direc-tionalFeature Pyramid Network,BiFPN）网络结构，提高了小目标安全帽佩戴情况的检测精度。文献12 引人了一种即插即用的轻量级通道注意力结构，用来抑制遥感图像中复杂背景信息的干扰，并且采用多尺度的特征融合网络以减少语义信息的丢失,实现了小尺度目标检测精度的提升。文献 13通过引人卷积注意力，使得网络更加集中于有益信息，抑制无益信息，从而提升了小目标的检测精度。文献 14 使用频率通道

14、注意力，引导模型更加关注有益特征，并且优化网络的输人尺寸，采用平滑标签的方式,进一步提高了算法的检测精度。上述学者均对YOLOv5算法进行了添加注意力机制的改进，有效提高了部分场景下的检测精度，但仍难以满足目标检测领域快速且准确的需求,核心问题在于忽略了网络结构不同位置对于融合注意力机制的影响。基于此，本文对YOLOv5网络结构中不同位置融合注意力机制有效性方面进行研究，并对现有的注意力机制融合结构进行优化和改进本文以YOLOv5为基础模型，选取RSOD遥感数据集，通过将注意力机制（CoordinateAttention，CA）融合到YOLOv5网络结构的骨干网络、颈部和输出端3个不同位置，对

15、融合后的算法有效性进行对比实验、选择。针对YOLOv5预测框回归效果不佳这一问题，采用CIoU_LOSS替换原有的GloU_LOSS。实验结果表明，本文提出的改进算法检测效果良好，在时效性和准确性方面均有提高2023年信息工程大学学报4401相关理论1.1YOLOv5算法YOLOv5共包括4个版本，本文采用基础的YOLOv5s进行改进。YOLOv5s主要包括输人端、骨干网络（Backbone）、颈部（Neck）及输出端（Predic-tion)4个部分。输人端主要对图像进行输人以及预处理等操作。骨干网络则包括Focus结构和跨阶段局部网络(Cross Stage Partial Network

16、,CSP）结构,负责对输人的图像进行特征提取,CSP15结构用来增大模型的特征学习范围。颈部则采用特征金字塔（FPN）16 以及路径聚合网络（PAN）17 进行多尺度的特征融合，从而增强网络的特征学习能力。输出端主要包括损失函数、预测边界框和非极大值抑制（No n-M a x i mu m Su p p r e s s i o n，NM S）18 3个部分。YOLOv5s的模型结构如图1所示。输人端骨干网络颈部160*160*6480*80*12840*40*25620*50*512输出端CBSCSPCBSCSPI_2CRSCSPT3CBSCSPLSPPFCBS上采样40*40*512输入6

17、40*6 40*340*40*25620*20*256320*320*32CSP21CBS上采样80*80*25680*80*12880*80*25540*40*12880*80*128CBSCoovBNSiLUReunitCRSCBS1CBS40*40*25640*40*128Cn(Sp2Cony1140*40*255140*40*256CBSCBSMaxPootMaxPoolMaxPoalCBS20*20*25620*20*512SPPFConcat20*20*2.5620*20*255MaxprntCSPILXCEBSReniCSP2.XCRSCESMaxpoolCBSSPPCBSC.B

18、SCBSslice图1YOLOv5s网络结构图1.2注意力机制注意力机制源于人类的视觉注意机制，即从大量信息中提取得到感兴趣的目标信息，通过突出有益信息、抑制低价值信息，从而实现有效特征的提取。因此,在网络中的合适位置融合注意力能够有效降低目标的复杂背景信息干扰，获得更加准确的目标特征信息，进而提高算法的检测精度。目前已有较多注意力机制，例如,压缩和激励（Squeeze andExcitation，SE）注意力19 通过将计算资源合理地投人不同通道上，能够大大增强模型的检测效果，但由于渠道的压缩,同时也对学习渠道之间的依赖关系产生了影响。有效通道注意力（EfficientChannelAtte

19、ntion,ECA）【2 0 由SE注意力改进得到，利用一维卷积层对跨通道信息进行汇总，从而获得更加准确的注意力信息，但由于ECA忽视了图像特征的位置信息,因此效果有限。基于卷积块的注意力机制(Convolutional Block Attention Module,CBAM)21作为包含通道域和空间域的混合型注意力，加强了通道特征与空间维度之间的关系，缺点是无法获取目标周围的依赖信息，以上通道域的轻量级注意力模型仅考虑了单一的通道信息，没有考虑图像中的位置信息。而对于混合型CBAM,即使综合考虑了通道信息与位置信息，但却缺乏长距离关系的提取能力。而CA22作为一种轻量级通道注意力，简单快速、

20、即插即用，兼顾通道以及长距离位置信息之间的关系，大大增强了移动网络学习特征的表达能力，使得移动网络能在避免大量计算开销的前提下参与较大的区域，性能优于SE、ECA、CBA M 等注意力。因此本文选用CA注意力进行融合实验，CA注意力的实现如图2 所示，ResidualCXHxWX Avg PoolXAvg PoolWxCX1Concat+Con2d(W+H)xC/rx1BatchNorm+Non-linear(W+H)xC/rx1Conv2dConv2dWxCx1SigmoidSigmoidWxCx1Re-weightCxHxW图2CA注意力机制模块示意图王龙博，等：利用注意力机制融合的YOL

21、Ov5遥感图像目标检测第4期441CA为了获取图像在宽度和高度方向上的注意力，并对准确位置信息进行编码，首先将输人的特征信息按照宽度和高度两个方向进行划分，分别获得宽度和高度的特征信息，如式（1）（2)所示。12(h)x.(h,i)(1)hiW1z(w)x.(i,w)(2)H0jH其次对全局感受野在宽度和高度两个方向的特征图进行拼接，利用11卷积、批归一化算法（Ba t c h No r ma l i z a t i o n，BN）和非线性激活进行特征转化，如式（3）所示f=8(F,(zh,z)(3)再次将具有横向和纵向空间信息的中间特征f划分成两个独立的特征和f，通过11卷积、Sigmoi

22、d激活函数实现特征转换，使其维数与输入的X向量相同，然后计算得到输入特征图在高度方向的注意力权重g和宽度方向的注意力权重g,如式(4）（5)所示。g*=(F,()(4)g=g(F.(f)(5)最后在原始特征图上通过加权乘法计算将输出的gh和g合并成权重矩阵，如式（6）所示。y(i,j)=x(i,j)g(i)gG)(6)2YOLOv5算法改进由于遥感图像的复杂多样性，将YOLOv5s算法直接应用于目标检测任务中，将会出现密集目标难以检测、多尺度目标定位精度不高、小目标易漏检误检等情况，导致目标检测模型的有效性大幅下降，因此需要对YOLOv5s网络做进一步的结构优化和调整。为了提高算法的检测精度，

23、本文根据现有的改进思路，在YOLOv5s的网络结构基础上，从骨干网络位置融合CA注意力以及更改损失函数两个方面进行改进2.1注意力机制融合设计注意力机制主要作用于特征图，因此通过在网络的合适位置融合注意力机制，能够有效提高网络的特征提取能力。但是由于YOLOv5s的骨干层、颈部层以及输出端分别对特征进行了不同的操作处理,因此将注意力融合在YOLOv5s网络的不同位置时,所带来的改进效果也会有所差异。为研究这一问题，本文结合YOLOv5s网络结构3个位置的不同特点：YOLOv5s的骨干层使用卷积网络生成样本特征，颈部层负责融合特征，输出端则进行特征的预测和输出，分别在YOLO5s的骨干层、颈部层

24、以及输出端融合CA注意力，设计了YOLOv5s_BackBone_CA,YOLOv5s_Neck_CA、YO LO v 5s _Pr e-diction_CA3个注意力融合模型进行实验。而YOLOv5s的输人端主要进行数据预处理等操作，与目标特征的提取或融合无关，因此不进行注意力机制的融合设计。CA注意力机制的融合设计如图3所示，其中图3（a）为YOLOv5s_BackBone_CA模型，对应将3个CA注意力模块融合在骨干层的CSP结构之后；图3(b）表示YOLOv5s_Neck_CA模型，对应将3个CA注意力模块融合在颈部层的Concat结构之后；图3（c）则表示YOLOv5s_Predic

25、tion_CA模型，对应将3个CA注意力模块融合在输出端的Conv层之后。骨干网络Focus骨干网络CSP(1)FocusCSP(1)CSP(2)CPS(2)CSP(3)CSP(3)SPPCASPP(a)YOLOv5s_BackBone_CA颈部颈部CSP(6)CSP(6)ConcatConcatConcatConcatCSP(5)CSP(5)CSP(7)CSP(7)ConcatConcatConcatConcatCSP(4)CSP(8)CSP(4)CSP(8)(b)YOLOv5s_Neck_CA2023年442信息工程大学学报输出端输出端ConvCAConvConvCAConvConvCon

26、vCA(c)YOLOv5s_Prediction_CA图3CA模块融合设计图为探究3个融合模型所带来的改进效果差异，采用RSOD数据集，对得到的注意力融合模型以及原始的YOLOv5s模型进行对比实验，实验结果如表1所示。表1CA模块融合实验结果单位：%网络模型PRmAP50YOLOv5s91.685.688.2YOLOv5s_Neck_CA93.085.189.3YOLOv5s_Prediction_CA92.781.986.1YOLOv5s_Backbone_CA87.687.890.7分析表1结果可得，由于在骨干层融合CA注意力能够充分利用目标的轮廓信息以及定位信息，从而更有效地抑制特征图

27、中的复杂背景信息，因此YOLOv5s_BackBone_CA模型的mAP50远高于另外两个融合模型，比原始YOLOv5s模型提高了2.5个百分点，表明在骨干层融合CA注意力所带来的改进效果最好，大大提高了检测精度。与原始的YOLOv5s模型相比，在颈部层融合CA注意力的mAP50提高了1.1个百分点，表明在颈部层融合CA注意力能够有效增强网络的特征提取能力，但由于特征在颈部层进行了传递和融合，导致部分信息发生丢失，因此在颈部层融合CA注意力所带来的改进效果低于骨干层。在特征进人输出端时，已完成了提取和融合操作，引发特征的感受野降低、语义信息有所丢失，从而导致在输出端融合CA注意力所得到的YOL

28、Ov5s_BackBone_CA模型，其mAP50比原始YOLOv5s模型下降了2.1个百分点。综上，在YOLOv5s骨干层位置融合CA注意力所带来的改进效果最好。为进一步验证在YOLOv5s骨干层融合CA注意力的有效性，将模型中CA注意力分别替换为SE、ECA 以及CBAM注意力，得到3个新的模型YOLOv5s_Backbone_CBAM、YO LO v 5s _Backbone_SE、YO LO v 5s _Ba c k b o n e _EC A,并在RSOD数据集上进行对比实验，实验结果如表2所示。表2 高融合不同注意力模块的对比实验结果单位：%网络模型PRmAP50YOLOv5s91

29、.685.688.2YOLOv5s_Backbone_SE91.081.088.5YOLOv5s_Backbone_ECA92.781.986.1YOLOv5s_Backbone_CBAM93.085.189.3YOLOv5s_Backbone_CA87.687.890.7如表2 所示，在YOLOv5s的骨干层分别融合SE、ECA、CBA M 注意力所得到的改进模型，其mAP50均得到了提高，且融合CA注意力模型的P、R 和mAP503个指标均为最高，证明了在网络骨干层融合CA注意力的有效性。2.2改进的损失函数YOLOv5s的损失函数是GIoU_LOSS23,其计算公式如式（7）所示。IC-

30、AUBLclou=1-IoU(A,B)+(7)IC式中，A、B分别表示预测框以及真实框,C表示A和B的最小边界框。具体位置关系如图4所示。BABCA图4预测框与真实框位置关系图GIoU_LOSS在IoU_LOSS的基础上引人了最小外接矩形，但由于GIoU_LOSS仅考虑了真实框与预测框之间的重合度,无法较好描述目标框的回归关系。另一方面，当目标预测框位于真实框的范围内，即BNA=A时,GIoU_LOSS也无法准确识别出不同预测框的位置，如图5所示王龙博，等：利用注意力机制融合的YOLOv5遥感图像目标检测443第4期ABBBBAAA图5真实框包含预测框示意图因此,本文选择更为完善的 CIoU_

31、Loss24 作为YOLOv5s的损失函数。CIoU_Loss不仅解决了GloU_Loss 存在的上述问题,而且考虑了边界框的尺度信息，增加了检测框尺度以及长宽比损失，使得预测框更符合真实框，实现了预测框与真实框的有效拟合。CloU_Loss如图6 所示。BABCA图6CIoU损失函数示意图CIoU_Loss的计算公式如下式所示。2(b,6)OLclou=1-IoU+V(8)二(9)(1-IoU)+V42WSWVarctanarctan(10)2Th式中W和分别表示目标框、预测框的宽高比。hCIoU_LOSS基于多维度的考虑,在增加了边界回归性能的同时改善了模型定位精度，使得预测框的回归效果更

32、好，并加快了收敛速度，同时也增强了对于多尺度目标检测的鲁棒性。3实验与分析本文利用RSOD数据集,对改进算法进行了训练与测试。首先，通过消融实验对各个改进模块的有效性进行评价。然后将改进算法与SSD、YOLOv3以及原始YOLOv5s算法进行对比，并选择部分测试结果加以可视化，以检验改进算法的有效性。3.1实验数据与环境实验使用含有不同尺度特征图像的RSOD数据集2 5，其包含4类目标在内的共2 32 6 张图像。其中图7(a)为飞机目标;图7(b)为油桶目标,图中油罐目标排列紧密且尺寸大小不一；图7（c)为立交桥目标，可以看出立交桥的背景信息较为复杂；图7（d）为操场目标图像(a)飞机图像(

33、b)油桶图像(c)立交桥图像(d)操场图像图7RSOD数据集样例实验使用Windows1064位操作系统，GPU为GeForceRTX3080Ti,选用Python3.8版本，编程平台使用Pycharm，深度学习框架为Pytorch1.8.0、CUDA11.1。实验时迭代次数Epoch设置为150次，BatchSize设置为16，具体实验环境配置如表3所示。表3实验环境参数配置操作系统Windows10 64位CPUIntel?CoreTMi7-11800CPUGeForceRTX3080TiPython3.8编程平台Pycharm显存16 CB深度学习框架Pytorch1.8.0,CUDA1

34、1.13.2评价指标从目标检测的准确性和时效性两个角度对改进算法进行评价。准确性评判指标采用均值平均精度（mean Average Precision,mAP）以及平均精度（A v e r a g e Pr e c i s i o n，A P）；时效性评价指标则采用2023年444程大学学报信息每秒检测的最大图像顿数（FramePerSecond,FPS）。各项指标的计算公式如下所示。TPP(11)recisionTP+FPTPR。(12)ecallTP+FN1MAPZAp(13)n1Ap=JP(R)dR(14)0NmFPST.o(15)式中:Precis表示准确率（Precision）;R

35、e c a l l 表示召回率(Recall);Ap指P-R曲线包围面积;MAp值由各类别Ap的平均值求得；TP表示检测正确的框数量；FP表示检测错误的框数量；FN表示未检测到GT的数量；Nn表示检测图片的总数量；T.。表示检测总时长。IoU=0.5是测试算法性能的常用标准，可以反映算法对各类目标的综合分类能力，故采用mAP50作为mAP评价指标3.3消融实验为了验证模型中CA注意力与CIoU_LOSS两个改进模块的有效性,本文以YOLOv5s为基准模型，对改进算法进行消融实验，实验结果如表4所示。表4消融实验结果单位：%网络模型PRmAP50YOLOv5s91.685.688.2YOLOv5

36、s_CA87.687.890.7YOLOv5s_CIoU93.085.189.3YOLOv5s_CA_CIoU90.887.491.1由表4可得，单独融合CA注意力模块所得到的YOLOv5s_CA模型以及单独替换CIoU_LOSS损失函数模块所得到的YOLOv5s_CIoU模型,均使得原始YOLOv5s算法的mAP50得到了提高，证明了改进模块的有效性。综合来看，即使改进算法YOLOv5s_CA_CIoU的准确率略低于单独引人CI-oU_LOSS损失函数模块所得到的YOLOv5s_CIoU模型，但YOLOv5s_CA_CIoU的召回率和mAP50分别达到8 7.4%、91.1%，较原始YOLO

37、v5s算法均有提高，表明融合CA注意力与替换CIoU_LOSS损失函数相结合所带来的改进效果最优,进一步验证了改进算法的有效性。3.4对比实验为更加全面验证改进算法的有效性，并进一步评估改进算法在检测精度以及速度等方面的提高，将本文所提出的改进算法与YOLOv3、SSD以及YOLOv5s算法进行比较研究。在相同训练条件下，采用同一数据集进行实验，结果如表5所示。表5主流算法检测结果对比AP/%网络模型mAP50/%参数FPS/Hz油桶飞机立交桥操场SSD97.497.482.351.782.223821685373YOLOv398.998.086.759.785.861 539 88967YO

38、LOv5s98.497.885.271.388.27 020 913103YOLOv5s_CA_CIoU97.093.888.670.091.17056593119由表5可得,改进算法YOLOv5s_CA_CIoU的检测精度最高，mAP50达到了91.1%，分别比SSD、YOLOv3以及YOLOv5s算法提高了8.9、5.3、2.9个百分点。即使改进算法的参数量略大于YOLOv5s算法，但检测速度FPS反而得到了提升，表明改进算法能够以增加少部分参数量为代价获得更高的检测精度。而SSD算法的网络结构较为简单，导致特征提取能力相对较弱,因此在面对目标背景复杂的检测任务时，检测精度较为有限。YOL

39、Ov3算法加强了特征融合，使得检测精度能力较SSD模型有所提高，但其仍远低于本文所提出的改进算法YOLOv5s_CA_CIoU。为进一步评估改进算法的检测效果，选取RSOD数据集中部分遥感图像的检测结果进行可视化对比，分别从是否存在漏检、误检，以及目标边界框的定位准确性等角度对飞机、油桶、立交桥、操场4类目标的检测效果进行评价。如图8 所示，从左至右依次为SSD、YO LO v 3、YOLOv5s以及YOLOv5s_CA_CIoU4种算法的可视化检测结果。其中：灰度值最大的框对应正确检测结果，中等灰度值的框代表误检，灰度值最小的框则表示漏检结果。王龙博，等：利用注意力机制融合的YOLOv5遥感

40、图像目标检测445第4期飞机油福立交桥樂场(a)SSD(b)YOLOv3(c)YOLOv5s(d)YOLOv5s_CA_CIoU图8检测结果可视化对比由可视化结果可得，对于飞机目标的检测，图像中飞机目标布局紧凑且尺寸大小不一。图8（a）中的SSD算法出现了漏检情况；图8（b）中YOLOv3算法也出现了漏检与误检的情况，将图像中两飞机之间的空白区域误判为飞机目标；图8（c）中的YOLOv5s算法也存在误检与漏检情况，未能检测到图像右侧的小型飞机目标；而图8（d）中的改进算法YOLOv5s_CA_CIoU则未出现误检、漏检等情况，证明小目标检测任务场景下，改进算法相较于原始YOLOv5s算法的检测

41、精度有了很大提高。对于油桶目标的检测,图8（a)中的SSD算法以及图8(b）中的YOLOv3算法均存在漏检情况，出现部分油桶目标未被有效检测；图8（c）中的YOLOv5s算法出现了误检情况，将待检测目标之间的空白区域误判为油桶目标；而图8（d）中的改进算法YOLOv5s_CA_CIoU则准确检测出了所有目标，证明本文所提出的改进算法有效提高了原始YOLOv5s算法在密集场景下的目标检测能力。对于立交桥以及操场目标的检测，与其他3种算法相比，图8（d）中的改进算法YOLOv5s_CA_CIoU不仅没有出现漏检、误检情况，而且对于目标边界框的定位也更加精准。综上，与SSD、YO LO v 3、YO

42、 LO v 5s 3种算法相比，本文提出的改进算法YOLOv5s_CA_CIoU检测精度更高、对于检测目标的边界框定位也更加精准,有效证明了改进算法的检测能力。4结束语针对YOLOv5s算法在目标密集分布、尺度不一等场景下所存在的漏检、误检等问题，本文提出了一种基于YOLOv5s的改进算法，选择YOLOv5s算法的骨干位置进行CA注意力机制的融合；并采用CIOU_LOSS损失函数，实验结果证明，改进算法的mAP50比原始YOLOv5s算法提高了2.9个百分点。可视化结果表明，本文所提出的改进算法有效降低了目标检测任务中误检和漏检数量，同时还提高了目标边界框的定位精度。下一步,将重点关注如何实现

43、更加高效以及轻量化的网络模型。参考文献：1 GIRSHICK R,DONAHUE J,DARRELL T,et al.Rich fea-ture hierarchies for accurate object detection and semanticsegmentation C/2014 IEEE Conference on Computer（编辑：高明霞）20233年信息工程大学学报446Vision and Pattern Recognition.Columbus,OH,USA:IEEE,2014:580-587.2(GIRSHICK R.Fast R-CNN C/2015 IEEE

44、InternationalConference on Computer Vision(ICCV).Santiago,Chile:IEEE,2015:1440-1448.3 REN S Q,HE K M,GIRSHICK R,et al.Faster R-CNN:towards real-time object detection with region proposalnetworksJ.IEEE Transactions on Pattern Analysis andMachine Intelligence,2017,39(6):1137-1149.4 LIU W,ANGUELOV D,ER

45、HAN D,et al.SSD:single shotMultiBox detector C/Computer Vision-ECCV 2016.Cham:Springer,2016:21-37.5REDMON J,DIVVALA S,GIRSHICK R,et al.You onlylook once:unified,real-time object detection C/2016IEEE Conference on Computer Vision and Pattern Recog-nition(CVPR).Las Vegas,NV,USA:IEEE,2016:779-788.6REDM

46、ON J,FARHADI A.YOLO9000:better,faster,stronger C/2017 IEEE Conference on Computer Vi-sion and Pattern Recognition（CVPR).H o n o l u l u,H I,USA:IEEE,2017:6517-6525.7 REDMON J,FARHADI A.YOLOv3:an incremental im-provementDB/0L.（2 0 18-0 4-0 8)2 0 2 1-0 3-2 5.h t t p s:/arxiv.org/abs/1804.02767.8 BOCHK

47、OVSKIY A,WANG C Y,LIAO H Y M.YOLOv4:optimal speed and accuracy of object detection DB/OL.(2020-04-23)2021-04-15 .https:/arxiv.org/abs/2004.10934.9邱天衡,王玲,王鹏，等.基于改进YOLOv5的目标检测算法研究J.计算机工程与应用，2 0 2 2,58（13）：6 3-73.10 赵睿,刘辉,刘沛霖，等.基于改进YOLOv5s的安全帽检测算法J/OL.北京航空航天大学学报：1-16.(2021-11-23)2022-10-02.https:/doi.o

48、rg/10.13700/j.bh.1001-5965.2021.0595.D01:10.13700/j.bh.1001-5965.2021.0595.11王玲敏，段军,辛立伟.引人注意力机制的YOLOv5安全帽佩戴检测方法J.计算机工程与应用，2 0 2 2,58(9):303-312.12赵文清，康瑾，赵振兵，等.改进YOLOv5s的遥感图像目标检测J.智能系统学报，2 0 2 3，18（1）：8 6-95.13李惠惠，范军芳，陈启丽.改进YOLOv5的遥感图像目标检测J.弹箭与制导学报，2 0 2 2,42（4）：17-2 3.14周华平，郭伟.改进YOLOv5网络在遥感图像目标检测中的应

49、用J.遥感信息，2 0 2 2,37（5）：2 3-30.15 WANG C Y,LIAO H Y M,WU Y H,et al.CSPNet:anew backbone that can enhance learning capability ofCNNC/2020 IEEE/CVF Conference on ComputerVision and Pattern Recognition Workshops(CVPRW).Seattle,WA,USA:IEEE,2020:1571-1580.16 LIN T Y,DOLL R P,GIRSHICK R,et al.Feature pyra-m

50、id networks for object detection C/2017 IEEE Con-ference on Computer Vision and Pattern Recognition(CVPR).Honolulu,HI,USA:IEEE,2017:936-944.17 LIU S,QI L,QIN H F,et al.Path aggregation network forinstance segmentationDB/OL.（2 0 18-0 3-0 5)2 0 2 0-11-12.https:/arxiv.org/abs/1803.01534.18NEUBECK A,VAN

下载提示：咨信网仅提供存储空间/不修改/不编辑

【自信AI创作助手】【自信AI导航】
1、请仔细预览页面，基本判断完整性，对于直接下载带来的问题请及时与客服沟通；下载的文档，不会出现我们的网址水印。
2、该文档所得收入（下载+内容+预览）归上传者、原创作者；如果您是本文档原作者，请点此认领！既往收益都归您。

同意并开始全文预览

举报此文档有问题？有机会获“体验VIP”奖励！

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

10 金币 0人已下载

申诉本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请申请举报、认领或删除 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 利用注意力机制融合 YOLOv5 遥感图像目标检测

咨信网温馨提示：
1、咨信平台为文档C2C交易模式，即用户上传的文档直接被用户下载，收益归上传人（含作者）所有；本站仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿，我们不确定上传用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的版权、权益或隐私，请联系我们，核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据，平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺，下载前须认真查看，确认无误后再购买，务必慎重购买；若有违法违纪将进行移交司法处理，若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传，付费前请自行鉴别，如您付费，意味着您已接受本站规则且自行承担风险，本站不进行额外附加服务，虚拟产品一经售出概不退款（未进行购买下载可退充值款），文档一经付费（服务费）、不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印，是因预览和防盗链等技术需要对页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有水印标识（原文档上传前个别存留的除外），下载后原文更清晰；试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓；PPT和DOC文档可被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；PDF文档不管是原文档转换或图片扫描而得，本站不作要求视为允许，下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用；网站提供的党政主题相关内容(国旗、国徽、党徽－－等)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
6、文档遇到问题，请及时私信或留言给本站上传会员【自信****多点】，需本站解决可联系【微信客服】、【 QQ客服】，若有其他问题请点击或扫码反馈【服务填表】；文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“【版权申诉】”（推荐），意见反馈和侵权处理邮箱：1219186828@qq.com；也可以拔打客服电话：4008-655-100；投诉/维权电话：4009-655-100。