基于改进YOLO v5s的轻量化植物识别模型研究.pdf
《基于改进YOLO v5s的轻量化植物识别模型研究.pdf》由会员分享,可在线阅读,更多相关《基于改进YOLO v5s的轻量化植物识别模型研究.pdf(10页珍藏版)》请在咨信网上搜索。
1、2023年8 月第54卷第8 期农业机械报学doi:10.6041/j.issn.1000-1298.2023.08.026基于改进YOLOv5s的轻量化植物识别模型研究马宏兴1董凯兵1王英菲魏淑花黄文广3苟建平4(1.北方民族大学电气信息工程学院,银川7 50 0 2 1;2.宁夏农林科学院植物保护研究所,银川7 50 0 0 2;3.宁夏回族自治区草原工作站,银川7 50 0 0 2;4.西南大学计算机与信息科学学院,重庆40 0 7 15)摘要:为方便调查宁夏全区荒漠草原植物种类及其分布,需对植物识别方法进行研究。针对YOLOv5s模型参数量大,对复杂背景下的植物不易识别等问题,提出一种
2、复杂背景下植物目标识别轻量化模型YOLOv5s-CBD。改进模型YOLOv5s-CBD在特征提取网络中引人带有Transformer模块的主干网络BoTNet(Bo t t l e n e c k t r a n s f o r m e rnetwork),使卷积和自注意力相结合,提高模型的感受野;同时在特征提取网络融入坐标注意力(Coordinateattention,CA),有效捕获通道和位置的关系,提高模型的特征提取能力;引人SIoU函数计算回归损失,解决预测框与真实框不匹配问题;使用深度可分离卷积(Depthwiseseparableconvolution,D SC)减小模型内存占用量
3、。实验结果表明,YOLOv5s-CBD模型在单块NvidiaGTXA5000GPU单幅图像推理时间仅为8 ms,模型内存占用量为8.9MB,精确率P为95.1%,召回率R为92.9%,综合评价指标F1值为94.0%,平均精度均值(mAP)为95.7%,在V0C数据集平均精度均值可达8 0.0 9%。相比YOLOv3-tiny、YO LO v 4-t i n y 和YOLOv5s,改进模型内存占用量减小,平均精度均值提升。模型YOLOv5s-CBD在公开数据集和宁夏荒漠草原植物数据集都有良好的鲁棒性,推理速度更快,且易于部署,已应用在宁夏荒漠草原移动端植物图像识别APP和定点生态信息观测平台,可
4、用来调查宁夏全区荒漠草原植物种类和分布,长期观测和跟踪宁夏盐池县大水坑、黄记场、麻黄山等地植物生态信息。关键词:植物识别;YOLOv5s;Bo T Ne t;坐标注意力;深度可分离卷积;轻量化中图分类号:S4文献标识码:A文章编号:10 0 0-12 98(2 0 2 3)0 8-0 2 6 7-10OSID:Lightweight Plant Recognition Model Based on Improved YOLO v5sMA HongxingDONG KaibingWANG YingfeilWEI ShuhuaHUANG Wenguang23GOU Jianping(1.Colle
5、ge of Electrical and Information Engineering,North Minzu University,Yinchuan 750021,China2.Institute of Plant Protection,Ningxia Academy of Agricultural and Forestry Sciences,Yinchuan 750002,China3.Ningxia Grassland Workstation,Yinchuan750002,China4.College of Computer and Information Science,Southw
6、est University,Chongqing 400715,China)Abstract:In ordered to facilitate the investigation of desert grassland plant species and their distributionin the whole Ningxia region,plant identification methods need to be studied.To address the problems oflarge number of parameters in YOLO v5s model,it is n
7、ot easy to recognize plants in complexbackgrounds,and a lightweight model of plant target recognition in complex backgrounds,YOLO v5s-CBD,was proposed.The improved model YOLO v5s-CBD introduced the BoTNet with Transformermodule into the feature extraction network,to combine convolution and self-atte
8、ntion to improve thefeeling field of the model.At the same time,coordinate attention was incorporated into the featureextraction network to effectively capture the relationship between channel and position and improve thefeature extraction ability of the model.In terms of loss calculation,the SloU f
9、unction was introduced tocalculate the regression loss to solve the problem of mismatch between the prediction box and the realbox.Using depthwise separable convolution to reduce model volume.The experimental results showedthat the model YOLO v5s-CBD infers a single image in only 8 ms,a model volume
10、 of 8.9 MB,aprecision of 95.1%,a recall of 92.9%,a F1 value of 94.0%,and a mean average precision of 95.7%in a single Nvidia GTX A5000 GPU,and a mean average precision of 80.09%in the VOC dataset.收稿日期:2 0 2 3-0 3-2 99修回日期:2 0 2 3-0 5-2 5基金项目:宁夏农业高质量发展和生态保护科技创新项目(NGSB-2021-140 5)、国家自然科学基金面上项目(6 197 6
11、 10 7)和北方民族大学重点研究项目(2 0 2 1JY005、YCX2 2 134)作者简介:马宏兴(197 5一),男,副教授,博士,主要从事信息感知与智能处理研究,E-mail:m h x n m u.e d u.c n268农2023年业机报学械Compared with YOLO v3-tiny,YOLO v4-tiny and YOLO v5s,the improved models reduced modelvolume and improved mean average precision.The model YOLO v5s-CBD had good robustness
12、in bothpublic dataset and Ningxia desert grassland plant dataset,faster inference speed and easy to deploy.Itwas applied in Ningxia desert grassland mobile plant image recognition APP and fixed ecologicalinformation observation platform,which can be used to investigate the species and distribution o
13、f desertgrassland plants in the whole region of Ningxia,and long-term observation and tracking of Dashuikeng,Huangjichang,Mahuangshan and other places,Yanchi County,Ningxia.Key words:plant recognition;YOLO v5s;BoTNet;coordinate attention;depthwise separableconvolution;lightweight0引言宁夏地处我国西北农牧交错带,在农牧
14、业发展中占据重要的地位。宁夏荒漠草原是全区分布面积最大的天然草原,约占草地总面积的一半以上。近年来,在各种自然因素及人类行为干扰下,荒漠草原出现诸如土壤沙化、草地生态系统的生产力下降、土壤肥力流失等一系列生态问题1-2 。面对这些问题,快速有效识别荒漠草原植物群落主要物种,是调查草地群落结构变化、划分草地类型、明确草地退化和修复现状,以及保护草地植物多样性的基础出3-4在实际调查中,植物物种的识别主要按照传统方法进行,既耗时又复杂。随着计算机视觉技术的进步,在植物识别领域已有大量基于机器学习的植物识别方法,能够快速有效识别植物种类。目前对植物识别的研究中,有支持向量机5、K最近邻6 、深度学习
15、和胶囊网络等7 。在深度学习领域中,孙俊等8 针对CNN训练收敛时间长、模型参数庞大的问题,对网络模型进行改进,提出一种批归一化与全局池化相结合的卷积神经网络识别模型,对14种不同植物共2 6 类病害的平均测试识别准确率达到99.56%,参数内存占用量为2.6 MB,推理时间为20.79ms。G U A NG 等9 提出了一种基于高效通道注意力(ECAENet)的轻量级植物物种识别算法,使用神经架构搜索来获得基线网络,复合系数统一缩放深度、宽度和分辨率的所有维度,在SwedishLeaf、FlaviaLeaf数据集的准确率分别达到99.56%和99.75%。BA R R A D A S等10
16、基于EfficientNet模型的自然环境中药用植物物种的实时自动识别系统,识别精度可达到7 8.5%。CHEN等 基于改进YOLOv5对橡树病害进行识别,从橡胶树病害数据库中随机抽取样本图像形成训练集和测试集,改进网络平均精度达到7 0%,相比原模型提高5.4%。项和雨等12 通过改进的深度卷积神经网络RAN-11,以残差注意力Attention-56模块和Attention-92为基础,将底层与顶层的通道特征融合,调整注意力模块和残差块个数压缩模型,对浮游植物识别准确率可达到95.6 7%。在胶囊网络识别中,温长吉等13提出一种改进稠密胶囊网络模型,对32 像素32像素的植物图像,平均识别
17、准确率达到7 7.2%,参数量仅为1.8 10 上述算法中,支持向量机针对高维度数据计算复杂;K近邻需要大量数据集支撑训练,而且占用内存大;EfficientNet模型体积较大,推理速度慢;YOLOv5对于复杂植物图像识别精度较低;胶囊网络适合低分辨率图像,对分辨率较高图像不友好。本文基于YOLOv5s网络,以宁夏荒漠草原植物为研究对象,拟对复杂背景下轻量级植物目标识别模型进行研究。在模型中拟引人BoTNet14和坐标注意力机制CA15来有效提升对植物特征的提取能力;引人深度可分离卷积DSC来减小模型体积16 ,加快模型推理速度,实现模型的轻量化;引入回归损失函数SIoU来加快数据拟合【17
18、;同时,对改进后的轻量化识别模型应用进行研究,以期应用于宁夏荒漠草原植物移动端识别和定点观测。1植物数据集采集宁夏荒漠草原17 类常见植物,对植物数据集进行清洗和增强处理,如图1所示。1.1植物数据主要采集宁夏盐池县麻黄山、大水坑,同心县罗山等地区17 类常见植物,分别为青海首(M e d i c a g o a r c h i d u c i s-n i c o l a i)、长芒草(Stipabungeana)、甘草(Glycyrrhizauralensis)、猪毛菜(Sa l s o l a c o l l i n a)、兴安胡枝子(Lespedeza davurica)、二色补血草(L
19、imoniumbicolor)、蒲公英(Taraxacummongolicum)、草木犀状黄芪(Astragalusmelilotoides)、平车前(Plantagodepressa)、小车前(Pl a n t a g o mi n u t a)、反枝苋(Amaranthus blitum)、乳苣(Lactucatatarica)、刺齿枝子花(Dracocephalumperegrinum)、披针叶黄华(Thermopsislanceolata)、地梢瓜(Cynanchumthesioides)、二裂委陵菜(Potentilabifurca)、圆叶锦葵(Malvapusilla)。由于宁夏属
20、温带大陆性干旱、半干旱气候,降水269马宏兴等:基于改进YOLOv5s的轻量化植物识别模型研究第8 期(a)地梢瓜(b)刺齿枝子花(c)披针叶黄华(d)反枝苋(e平车前(f)二裂委陵菜(g)青海首(h)长芒草(i)草木棍状黄芪(i)二色补血草(k)甘草(1)兴安胡枝子(m)乳(n)小车前()圆叶锦葵(p)猪毛菜(q)蒲公英图1植物部分图像数据Fig.1Images of plants偏少且相对集中,光能丰富,蒸发强烈,植被覆盖以沙生植物为主,大部分植物叶片窄小。当对叶片进行采集时,难以获取有效信息,因此,植物数据集采用整株植物。由于荒漠草原植物在自然环境中与背景相似、特征不明显,不利于识别与分
21、析,为丰富植物数据多样性,提高识别模型泛化能力,数据采集时选取不同角度、不同光照环境下的自然图像数据,分辨率为30 0 0 像素40 0 0 像素。采集得到宁夏荒漠草原常见植物图像数据共17类,1953幅,7.2 CB。对部分拍摄模糊、枝叶遮挡等特征不明显的植物图像进行数据清洗后,得到植物图像数据共17 类,18 92 幅,其中青海首94幅、长芒草10 1幅、甘草6 6 幅、猪毛菜10 3幅、兴安胡枝子8 8 幅、二色补血草12 0 幅、蒲公英156 幅、草木犀状黄芪142 幅、平车前136 幅、小车前10 7 幅、反枝苋10 1幅、乳苣132 幅、刺齿枝子花132 幅、披针叶黄华117 幅、
22、地梢瓜10 8 幅、二裂委陵菜92 幅、圆叶锦葵97 幅,7.0 GB。1.2数据增强采用马赛克数据增强和传统图像增强相结合的方法,扩展宁夏荒漠草原植物图像样本的丰富度,提高模型的泛化能力和鲁棒性。在此选择4幅图像进行马赛克增强,马赛克增强实验结果如图2 所示,(a)原始数据(b)增强数据图2数据增强Fig.2Dataaugmentation1.3数据标注为了提高目标检测模型输出的准确性,使得网络模型能够学习到植物的特征与位置信息,需要对图像中的植物进行标注。标注时使用Labellmg工具制作VOC格式数据集,文件中包含植物名称和位置信息。图像和标注文件均用于模型训练和验证。2轻量化植物识别模
23、型设计由于YOLOv5s对复杂目标识别精度低,参数量较大,所以在实际应用中需要对网络模型进行改进,提升识别精度的同时,降低模型的参数量,加快模型推理速度。2.1网络模型结构设计改进的网络模型命名为YOLOv5s-CBD,模型结构如图3所示BackboneCBSDSC+BN+SiLU-1C3_1CBSBotNet*nConcatCBS11CBS1CBSNeckHead1CBSConcatC311C3UpsampleCBS80 x801不CACBSConcat不CBSC3C3-111114040C3.1CBS1Concat111立111CAUpsampleConcat1120 x2011立11SP
24、PFCBS11C3图3YOLOv5s-CBD结构Fig.3YOLOv5s-CBDstructure图3中,YOLOv5sCBD 分为3部分,其中Backbone对输入植物图像进行特征提取,Neck对获取的特征图进行特征融合,Head进行回归预测YOLO v5s-CBD首先在特征提取网络2023年农270机业报学械Backbone中引人带有Transformer18模块的轻量级主干网络BoTNet,扩大模型的全局感受野;同时融人轻量级坐标注意力机制CA来有效捕获位置和通道的关系,提高模型对关键信息的特征提取能力;其次在输出端Head引入SIoU函数计算回归损失,提升模型的收敛能力;最后使用深度可
25、分离卷积DSC减小模型的体积,实现改进模型的轻量化,提升模型识别速度。2.2BoTNet网络由于高分辨率植物图像中部分图像背景复杂,特征不明显,而YOLOv5s主干特征提取网络为C3网络,只具有平移不变性和局部性,不具有全局建模和长距离建模能力,为了提高模型的特征提取能力,在此引人BoTNet。BoTNet是一种结合CNN和Transformer的骨干网络,同时使用了卷积和自注意力机制,其模型结构是在ResNet19的最后3个bottleneckblocks中使用全局多头自注意力(Multi-headself-attention,MHSA)替换33空间卷积。全局多头自注意力是Transform
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于改进YOLO v5s的轻量化植物识别模型研究 基于 改进 YOLO v5s 量化 植物 识别 模型 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。