基于改进YOLOv8模型的巡检机器人目标检测方法研究.pdf
《基于改进YOLOv8模型的巡检机器人目标检测方法研究.pdf》由会员分享,可在线阅读,更多相关《基于改进YOLOv8模型的巡检机器人目标检测方法研究.pdf(8页珍藏版)》请在咨信网上搜索。
1、窑医疗卫生装备窑 2024年3月第45卷第3期悦澡蚤灶藻泽藻 酝藻凿蚤糟葬造 耘择怎蚤责皂藻灶贼 允燥怎则灶葬造 窑 灾燥造援 45 窑 晕燥援 3 窑 March 窑 2024基于改进YOLOv8模型的巡检机器人目标检测方法研究殷北辰,王子健,程智*,徐新喜*(军事科学院系统工程研究院,天津300161)摘要目的院针对巡检机器人对指针式仪表识别准确率不够高、对被遮挡仪表识别效果较差的问题,提出一种基于改进YOLOv8模型的巡检机器人目标检测方法。方法院首先,以YOLOv8n模型作为基础目标检测模型,在此基础上引入坐标注意力机制,加强模型对输入数据的空间结构理解;其次,将损失函数由完整交并比(
2、complete IoU,CIoU)损失函数替换为高效交并比(efficient IoU,EIoU)损失函数,加快模型检测框的收敛速度;最后,采用柔性非极大值抑制(soft non-maximum suppression,Soft-NMS)函数替代传统的非极大值抑制(non-maximum suppression,NMS)函数,以更加平滑地抑制冗余的边界框,进一步提高检测的准确率。为验证改进模型对检测目标的识别效果,将YOLOv8n模型与改进后的YOLOv8模型(YOLOv8nxt模型)进行对比。结果院与YOLOv8n模型相比,YOLOv8nxt模型的位置损失值降低了1.3%,mAP_0.5:
3、0.95提高了1.7%,检测准确率提高了0.87%,模型大小仅为6.2 M,检测时间仅增加了0.2 ms。结论院基于改进YOLOv8模型的巡检机器人目标检测方法提升了巡检机器人在运动过程中对仪表的识别精度和速度,能有效解决巡检机器人在目标检测阶段存在的问题。关键词YOLOv8模型;巡检机器人;目标检测;注意力机制中国图书资料分类号R318曰TP242.3文献标志码A文章编号1003-8868渊2024冤03-0001-08DOI院10.19745/j.1003-8868.2024041Improved YOLOv8 model-based object detection method for
4、inspection robotYIN Bei-chen,WANG Zi-jian,CHENG Zhi*,XU Xin-xi*(Systems Engineering Institute of Academy of Military Science,Peoples Liberation Army,Tianjin 300161,China)AbstractTo propose a object detection method based on an improved YOLOv8 model to solve the problems ofthe inspection robot in low
5、 accuracy for recognizing pointer-type or obscured meters.Firstly,a YOLOv8 model waschosen as the foundation object detection model,based on which the coordinate attention(CA)mechanism was introduced toenhance the models understanding of the spatial structure of the input data over long distances;se
6、condly,the originalcomplete IoU(CIoU)loss function was replaced by an efficient IoU(EIoU)loss function to accelerate the convergence of themodels detection frame;finally,the soft non-maximum suppression(Soft-NMS)function took the place of the traditionalNMS method to suppress the redundant bounding
7、box smoothly and further improve the detection accuracy.The improvedYOLOv8 model(YOLOv8nxt model)was compared with the YOLOv8n model to verify its efficacy for object detection.The YOLOv8nxt model with a size of 6.2 M had the position loss decreased by 1.3%,mAP_0.5:0.95 increased by 1.7%,detection a
8、ccuracy raised by 0.87%and detection time prolonged by only 0.2 ms when comparted with the YOLOv8n model.The improved YOLOv8 model-based object detection method enhances the accuracy and speed of the inspectionrobots recognition of meters during movement,and can effectively solve the problems of the
9、 inspection robot in the objectdetection stage.悦澡蚤灶藻泽藻 酝藻凿蚤糟葬造 耘择怎蚤责皂藻灶贼 允燥怎则灶葬造袁2024袁45渊3冤院1-8Key wordsYOLOv8 model;inspection robot;object detection;attention mechanism0引言生物安全实验室也称生物安全防护实验室,是通过防护屏障和管理措施来避免或控制被操作的有害生物因子危害,达到生物安全要求的生物实验室和动物实验室。诸多新发未知和突发烈性病原体研究需要在高等级生物安全实验室中进行1。目前实验室的安全监测主要依赖设备层人工巡检的
10、方式,该方式存在安全风险,且无法实时保障巡检质量。将智能机器人技术引入实验室设备层是现阶段满足高等级实验室安全管控要求的最佳选择2。采用智能机器窑研究与设计窑作者简介院殷北辰(1996),男,硕士研究生,研究方向为机动卫生装备人机工程,E-mail:。通信作者院程智,E-mail:;徐新喜,E-mail:栽澡藻泽蚤泽论著殷北辰,王子健,程智,等.基于改进YOLOv8模型的巡检机器人目标检测方法研究J.医疗卫生装备,2024,45(3):1-8.1 窑医疗卫生装备窑 2024年3月第45卷第3期悦澡蚤灶藻泽藻 酝藻凿蚤糟葬造 耘择怎蚤责皂藻灶贼 允燥怎则灶葬造 窑 灾燥造援 45 窑 晕燥援 3
11、 窑 March 窑 2024人技术进行设备层巡检,既具有人工巡检的灵活性和智能性,同时克服和弥补了人工巡检中人员工作环境危险、压抑,并且工作质量无法保证等缺陷和不足。运用目标检测方法对设备层目标仪表进行识别能实现巡检机器人对目标的准确识别3,从而提高巡检机器人工作的效率并缩短巡检时长。近年来,许多学者提出了不同的目标识别检测模型4。比如以区域卷积神经网络(region covolu-tional neural networks,R-CNN)系列为代表的两阶段算法模型5,该算法模型采用区域提取操作,首先利用卷积神经网络(covolutional neural networks,CNN)骨干网提
12、取图像特征,然后从特征图中找出可能存在的候选区域,最后在候选区域上进行滑动窗口操作,进一步判断目标类别和位置信息。为进一步提高目标检测的实时性,一些学者提出将目标检测转化到回归问题上的简化算法模型,如YOLO系列和单发多框检测器(single shot multibox detector,SSD)系列基于位置回归的单阶段目标检测模型6,在提高检测精度的同时提高了检测速度。Li等7提出了一种新的目标检测框架,通过增加多角度锚框来处理目标的多尺度问题,设计了双通道特征融合网络,沿着2个独立的路径学习局部和上下文属性,以解决目标外观模糊问题。Zhu等8在YOLOv5的基础上采用增加一个检测不同尺度的
13、物体的预测头、用变形预测头(transformer predictionheads,TPH)替换原有的预测头、整合卷积块注意力模型(convolutional block attention module,CBAM)的方式使无人机检测的平均准确率(average precision,AP)提高了7%。Zhai等9使用空间深度转换卷积(space-to-depth convolution,SPD-Conv)代替卷积提取多尺度特征,对YOLOv8模型进行改进,更好地保留了微小目标的特征,并去除了大目标检测头,使模型大小减小了57.9%。针对巡检机器人仪表识别过程中存在巡检机器人主动识别仪表时采用复
14、杂模型准确率较高但速度慢,而采用简易模型速度快但准确率较低的问题,本文拟构建基于改进YOLOv8模型的巡检机器人识别目标仪表方法,通过选择不同的模型结构、引入注意力机制、改进损失函数和采用柔性非极大值抑制(soft non-maximum suppression,Soft-NMS)函数,提升巡检机器人在运动过程中对仪表的识别精度和速度,实现巡检机器人的工程应用。1YOLOv8模型2023年1月,Ultralytics团队在YOLOv7的基础上提出一种识别速度更快、性能更强的YOLOv8模型,其引入了新的Pytorch训练和部署框架,使得自定义模型的训练变得更加方便10。YOLOv8算法共有5种
15、网络结构,分别是YOLOv8n、YOLOv8s、YOLOv8m、YOLOv8l和YOLOv8x,5种网络结构的区别在于Backbone(骨干网络)及Neck(多尺度特征融合模块)部分卷积的次数和残差块的数目不一样,但基本原理相同11。YOLOv8网络结构图如图1所示12,其网络模型分为3个部分,分别为Backbone、Neck和Head(预测端)。(1)Backbone:采用一系列卷积和反卷积层来提取特征,同时使用残差连接和瓶颈结构来减小网络的大小并提高性能。该部分采用C2f模块作为基本构成单元。Backbone部分由5个CBS模块、4个C2f模块和1个快速空间金字塔池化(spatial py
16、ramidpooling-fast,SPPF)模块组成。(2)Neck:采用多尺度特征融合技术,将来自Backbone不同阶段的特征图进行融合,以便更好地捕捉不同尺度目标的信息,从而提高了目标检测的性能和鲁棒性。(3)Head:负责最终的目标检测和分类任务,设有3个检测头,用于在不同的尺寸信息下检测目标信息。检测头包含一系列卷积层和反卷积层,用于生成检测结果。尽管YOLOv8相较于YOLOv1YOLOv7已经具有了良好的检测性能和推理速度,但针对巡检机器人的工作环境,仍然存在以下问题:(1)在YOLOv8模型中,结构越复杂,深度越深,检测效果越好。但是相应的越复杂的模型其参数也就越多,训练效率
17、越低且权重越高,检测时需要更多的运算资源,严重降低了目标检测实时性,不适于在机器人端部署。(2)在巡检机器人运动过程中,采集的视频信息绝大部分为无用信息,大量的视频信息输入占用大量的运算资源,降低了目标检测的实时性和稳定性。(3)当预测框在目标框内部且预测框大小一致时,边界框回归损失函数将由完整交并比(completeIoU,CIoU)损失函数退化为简单的IoU损失函数,无法实现准确预测框的定位和更好地对模型进行优化;且训练过程中应用CIoU损失函数预测框在水平或垂直方向上优化困难,收敛较慢,降低了训练效率13。(4)在目标检测的后处理过程中,针对很多目标框的筛选,通常采用非极大值抑制(non
18、-maximum su-ppression,NMS)算法操作。NMS算法对于重叠阈值设定敏感,设定过低会导致漏检,设定过高会导致误检,对于部分重叠目标的识别仅能检测出未被遮挡目栽澡藻泽蚤泽论著殷北辰,王子健,程智,等.基于改进YOLOv8模型的巡检机器人目标检测方法研究J.医疗卫生装备,2024,45(3):1-8.2 窑医疗卫生装备窑 2024年3月第45卷第3期悦澡蚤灶藻泽藻 酝藻凿蚤糟葬造 耘择怎蚤责皂藻灶贼 允燥怎则灶葬造 窑 灾燥造援 45 窑 晕燥援 3 窑 March 窑 2024标,而对于被部分遮挡目标则不会输出检测结果14。2模型改进策略2.1选取合适模型本研究中目标检测对象
19、为体积较小的指针式仪表,为了设计出适用于本文应用环境的模型,综合考虑训练效率和检测精度等问题,将YOLOv8的5个预训练模型采用仪表数据集进行训练。对训练后的模型通过测试数据集进行检测,选出最优模型。2.2引入注意力机制注意力机制主要用于解决小目标检测问题,与本文的应用场景非常匹配,注意力机制的引入能很好地解决巡检机器人在运动过程中目标检测的实时性和稳定性问题。坐标注意力机制是一种用于加强深度学习模型对输入数据的空间结构理解的注意力机制。先前的轻量网络的注意力机制大多数采用了压缩和激励(squeeze-and-excitation,SE)模块,仅考虑了通道之间的信息,忽略了位置信息15。尽管后
20、来的CBAM尝试在降低通道数后通过卷积来提取位置注意力信息,但卷积只能提取局部信息,缺乏对长距离关系提取的能力。为此,有学者提出了新的高效注意力机制,能够将横向和纵向的位置信息编码到通道注意力中,使得移动网络能够在关注大范围位置信息的同时不会带来过多的计算量16。注意力机制的结构如图2所示。设输入的特征图通道数为C,图像纵向高度为H,横向宽度为W,注意力机制首先对输入特征图C,H,W进行2次全局平均池化,一次在宽度方向上,一次在高度方向上。这2次操作分别得到2个特征映射:在宽度方向上的平均池化得到的特征映射C,H,1和在高度方向上的平均池化得到的特征映射C,1,W。这2个特征映射分别捕捉了在宽
21、度和高度方向上的全局特征。这2个特征映射也允许注意力模块捕捉到沿着一个空间方向的长期依赖关系,并保存沿着另一个空间方向的精确位置信息,这有助于网络更准确地定位感兴趣的目标。将上述2个特征映射合并,通过简单的堆叠操作,得到一个新的特征层,尺寸为C,1,H+W,在宽度和高度2个方向上的维度合并在一起。然后对合并后的特征层进行卷积操作、标准化和激活函数操作来进注:CBS为卷积层(convolutional layer)+批量归一化(batch normalization)+激活函数(SiLU)的组合;C2f为卷积层(convolutional layer)到全连接层(fully connectedl
22、ayer)的组合。图1YOLOv8网络结构图BackboneNeckHead输入输出CBSCBSCBSCBSCBSC2fC2fC2fC2f快速空间金字塔池化上采样拼接拼接拼接拼接C2fC2fC2fC2f上采样CBSCBS快速空间金字塔池化检测头检测头检测头CBSCBSCBS卷积层 批量归一化激活函数瓶颈层相加CBSCBSCBSCBSCBSCBSCBSCBSC2f检测头分割瓶颈层瓶颈层拼接最大池化层最大池化层最大池化层拼接卷积层卷积层锚框损失分类损失图2注意力机制结构图栽澡藻泽蚤泽论著输入输出特征图权重更新宽度方向平均池化高度方向平均池化卷积+激活函数合并宽高特征+卷积批量归一化+非线性激活函数
23、卷积+激活函数特征图分裂殷北辰,王子健,程智,等.基于改进YOLOv8模型的巡检机器人目标检测方法研究J.医疗卫生装备,2024,45(3):1-8.3 窑医疗卫生装备窑 2024年3月第45卷第3期悦澡蚤灶藻泽藻 酝藻凿蚤糟葬造 耘择怎蚤责皂藻灶贼 允燥怎则灶葬造 窑 灾燥造援 45 窑 晕燥援 3 窑 March 窑 2024一步处理特征,最后分离得到在宽度和高度维度上的注意力向量17。在巡检机器人运动过程中,使用注意力机制可以从相机获取的视频信息提取注意区域,使得YOLOv8目标检测过程中能够关注更多待检测信息18。2.3EIoU损失函数改进YOLOv8原算法中采用CIoU损失函数19,
24、CIoU虽然提高了边界框宽高比的尺度信息权重,增加了检测框尺度以及长和宽的损失20,但由于宽高比描述的是相对值,所以有研究21在CIoU的基础上计算纵横比,提出了高效交并比(efficient IoU,EIoU)损失函数。EIoU的惩罚项在CIoU的惩罚项基础上将纵横比的影响因子拆分后分别计算目标框和预测框的长和宽,该损失函数包含重叠损失、中心距离损失、宽高损失3个部分。前2个部分延续CIoU中的方法,但是宽高损失直接使目标框与预测框的宽度和高度差达到最小,使得收敛速度更快。EIoU惩罚项计算公式如下22:LEIoU=1-IoU+籽2(b,bgt)cw2+ch2+籽2(w,wgt)cw2+籽2
25、(h,hgt)ch2(1)式中,cw和ch分别表示覆盖2个检测框的最小外接框的宽度和高度;b和bgt分别表示预测框和真实框的中心点;w和wgt分别表示预测框和真实框的宽;h和hgt分别表示预测框和真实框的高;籽表示2个中心点间的欧式距离。将YOLOv8中原本的损失函数CIoU改为EIoU,可能会使YOLOv8的目标检测取得更好的效果。2.4预测框改进Soft-NMS是一种改进的目标检测算法,用于在NMS过程中更加平滑地抑制冗余的边界框23。传统的NMS方法是通过设置一个固定的阈值来判断2个边界预测框是否重叠并进行抑制24。然而,固定的阈值可能无法很好地适应不同目标之间的交叠情况14,25,导致
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 改进 YOLOv8 模型 巡检 机器人 目标 检测 方法 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。