基于多分支注意力改进的YOLOv5无人艇目标检测方法.pdf
《基于多分支注意力改进的YOLOv5无人艇目标检测方法.pdf》由会员分享,可在线阅读,更多相关《基于多分支注意力改进的YOLOv5无人艇目标检测方法.pdf(9页珍藏版)》请在咨信网上搜索。
1、第6卷 第5期2023年10月无人系统技术Unmanned Systems TechnologyVol.6 No.5October 2023基于多分支注意力改进的YOLOv5无人艇目标检测方法孙备,党昭洋*,吴鹏,张家菊,左震(国防科技大学智能科学学院,长沙410072)摘要:针对水面无人艇目标检测类别多、尺寸小、形变大等难题,提出了基于多分支注意力改进的YOLOv5检测算法。首先提出了一种SAv2Attention模块,通过对通道的“复制-转换-合并”等处理,实现卷积层通道间与通道内特征融合,提升网络的局部感受野,然后将其嵌入到YOLOv5网络,最后在构建的真实海试数据集上进行了大量对比实验
2、。结果表明,SAv2Attention可有效提升YOLOv5的检测精度,典型海面目标数据集上,mAP0.5检测精度达到94.6%,mAP0.5:0.95检测精度达到60.9%,相较于原生算法分别提高1.4%和3%,对小尺寸目标平均检测率APS提升4.3%,证明所提方法能有效提升无人艇对水面小目标的检测能力。关键词:无人艇;水面目标检测;小目标;通道融合;YOLOv5;注意力;深度学习中图分类号:TP274.2 文献标识码:A 文章编号:2096-5915(2023)05-089-09DOI:10.19942/j.issn.2096-5915.2023.05.52USV Target Detec
3、tion Based on Improved YOLOv5 with Multi Branch AttentionSUN Bei,DANG Zhaoyang*,WU Peng,ZHANG Jiaju,ZUO Zhen(College of Intelligent Science,National University of Defense Technology,Changsha 410072,China)Abstract:In order to address the challenges of unmanned water craft target detection tasks such
4、as multiple categories,small size and large deformation.This paper proposed a improvement YOLOv5 detection method based on a novel multi branch attention.The method firstly proposed a SAv2Attention module,which utilized processing of copy transform merge to realize feature fusion between convolution
5、 channels in the accretion layer,and improve the local receptive field of the network.Then the SAv2Attention module is embed into YOLOv5 network.And finally,a dataset with real sea trial image is built and extensive comparative experiments are carried out.The results show that SAv2Attention can effe
6、ctively improve the detection 收稿日期:2023-05-06;修回日期:2023-06-12基金项目:国家自然科学基金(52101377)作者简介:孙备,博士,副研究员。通讯作者:党昭洋,硕士研究生。引用格式:孙备,党昭洋,吴鹏,等.基于多分支注意力改进的YOLOv5无人艇目标检测方法 J.无人系统技术,2023,6(5):89-97.Sun B,Dang Z Y,Wu P,et al.USV Target Detection Based on Improved YOLOv5 with Multi Branch Attention J.Unmanned Syste
7、ms Technology,2023,6(5):89-97.第 6 卷无人系统技术accuracy of YOLOv5 on the sea surface target dataset.The detection accuracy mAP0.5 reaches 94.6%,and mAP0.5:0.95 reaches 60.9%,which is improved by 1.4%and 3%respectively compared to the native algorithm.Furtherly,the average detection rate of small target AP
8、S is improved by 4.3%,which indicating that the proposed method proposed can effectively improve the detection ability of unmanned boats for small targets on water surface.Key words:USV;Water Surface Target Detection;Small Object;Channel Fusion;YOLOv5;Attention Mechanism;Deep Learning1 引 言 作为海洋智能机器人
9、技术的发展产物,无人艇在巡逻、导航、排雷反潜等领域有着巨大的应用价值1。为了拓展作业领域,无人艇会搭载多种传感器,通过智能模型对潜在威胁目标进行检测识别,实现环境目标的多重感知2。然而,受海洋环境日益复杂、作业任务日渐多样、活动范围日趋扩大的影响,无人艇环境感知还面临诸多挑战3。复杂场景下海面目标图像受海浪、风浪和光照变化等因素影响,目标呈纹理弱、尺寸小、形变大等特点,使得通用面向近距离平视场景的目标检测方法难以实现有效检测4-5。基于此,本文围绕远距场景下无人艇环境感知中的目标尺寸小、形变大等难题开展研究,在对 YOLO 系列主流检测算法进行分析和对无人艇光电探测系统进行设计的基础上,首先构
10、建了典型水面目标数据集;然后重点设计了一种SAv2Attention注意力模块并将其嵌入到YOLOv5模型中;最后,基于典型水面目标数据集进行了大量对比实验,实验结果表明了本文方法在无人艇目标检测方面的优越性。2 YOLO系列目标检测算法综述 图1所示为深度学习目标检测算法的发展历程6。其中,以YOLO为代表的单阶段目标检测算法7兼具检测精度和检测效率,后续又涌现了众多基于其改进的版本,成为目标检测领域应用最广泛的网络之一。2015年,YOLOv1在卷积特征提取的基础上通过全连接层分类回归实现目标检测。后续的改进主要是通过多尺度卷积融合的思想,以提升多尺度检测效果。例如YOLOv2设计了pas
11、s through层,通过不同层特征图的拼接实现多尺度特征预测;YOLOv3 引入特征金字塔结构预测不同尺度的目标,通过在多个不同尺度的特征层上设置锚点,实现多尺度细节和语义融合;YOLOv4在输入端引图1基于深度学习的目标检测算法发展历程Fig.1Development of object detection algorithms based on deep learning90第 5 期孙备等:基于多分支注意力改进的YOLOv5无人艇目标检测方法入了Mosaic数据增强方式,通过对图片进行随机缩放、随机裁剪以及随机排布的方式进行多尺度数据增强;YOLOv5 在输入层引入 Mosaic 数据
12、增强、自适应锚框计算,在 Backbone 层引入 Focus结构对图片进行切片处理,以及在 Neck 层中采用FPN+PAN 结构,通过上/下采样等操作实现特征融合,进而提升了对不同尺度目标的检测精度8-10。后续的YOLO系列改进网络则在总结近几年目标检测领域主流思想的基础上,通过数据增强、多尺度融合等思想进行设计11。本文选取YOLOv5作为基准模型,设计多分支注意力网络,以提升水面无人艇多尺度目标检测能力。3 无人艇探测平台设计 如图2所示,无人艇常用的视觉设备包括激光雷达、航海雷达、光电吊舱(可见光+红外)12。通常,单一传感器的工作性能容易受到天气、距离、自身工作条件等因素的影响,
13、无法全面获取海面环境信息。根据具体任务,研究者选择搭载合适的传感器,实现环境信息获取和海面目标感知。真实海域下无人艇环境感知任务可总结如下:在完成复杂海面目标实时精准检测的基础上,实现目标的精细化识别,同时关联雷达数据实现目标航迹和世界坐标系经纬位置的估测13。如图 3 所示,为无人艇目标探测总体框架,其中本文研究的可见光目标检测算法主要解决目标的类别检测问题,为无人艇综合感知提供信息支撑。基于该框架,本文设计了水面无人艇运动目标探测系统,如图4所示,为多传感器在无人艇的安装示意。之后基于设计的无人艇平台,在湛江等真实海域进行大量无人艇水面目标数据采集及实验验证。4 典型数据集构建 现有关于无
14、人艇目标探测的公开数据集相对较少,本文在湛江海域,基于构建的无人艇系统采集了大量真实海域的舰船目标,并参照国际现有船舶分类标准建立了海面目标分类数据集,使用labelImg软件完成了数据集标注14。如图5所示,采集了不同场景下的水面目标数据,通过调整光电球的视角和方向,收集了快艇(cutter)、渔船(trawler)、军舰(naval)、其余船只(ship)、水鼓(drum)、浮标(buoy)、桥墩(pier)等多类水面目标。图2典型水面无人艇视觉传感设备Fig.2Typical visual sensors for surface unmanned craft图4无人艇多传感器安装示意Fi
15、g.4Installation of multiple sensors for unmanned boats图3无人艇目标探测系统总体框架Fig.3Overall framework of USV target detection system91第 6 卷无人系统技术5 多分支注意力改进的YOLOv5目标检测算法 5.1无人艇海面目标特点图6列举了典型海面场景下的可见光图像。由图可知,海背景目标主要呈现以下特点:一是海背景目标尺寸小,随着距离和拍摄角度不同,同一目标的形变姿态变化大;二是受海背景水雾、光照散射以及无人艇运动等因素影响,目标背景的对比度低、纹理特征弱,目标容易淹没在背景中。基于
16、此,本文重点从小目标特征增强的角度,进行注意力结构设计,对现有方法进行改进。5.2多分支注意力结构设计通道和空间注意力成为近几年目标检测任务常用的改进方法,其中通道注意力关注不同卷积核作用,空间注意力关注空间位置作用,空间和通道注意力结合有助于模糊小目标特征提取15。本文融合空间和通道注意力特点,设计了一种新的注意力机制SAv2Attention(简称SAv2)。如图7所示,为SAv2的基础结构,其主体思想采用“分裂-转换-合并”思路,其中“分裂”是通过复制实现通道拓展,以保证“分裂”后每个分支维数一致,“转换”针对不同分支采取Spatial Shift and Se Concat 操作和 S
17、huffle Concat 操作,以实现不同形式的特征融合,“合并”操作是通过维度拼接、随机通道混洗等操作实现两个分支的特征融合。SAv2 由通道分裂、Spatial Shift and Se Concat转换、Shuffle Concat转换和通道拼接混洗合并4个模块组成16,其具体步骤如下:(1)通 道 复 制。给 定 一 个 输 入 张 量k Rw h b c,将其复制,得到两个相同维度的特征张量k1和k2。(2)Spatial Shift and Se Concat转换。对张量k1进 行 Spatial Shift and Se Concat 转换,具体算法如下。(3)Shuffle
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 分支 注意力 改进 YOLOv5 无人 目标 检测 方法
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。