基于改进YOLOv8的苹果检测方法.pdf
《基于改进YOLOv8的苹果检测方法.pdf》由会员分享,可在线阅读,更多相关《基于改进YOLOv8的苹果检测方法.pdf(4页珍藏版)》请在咨信网上搜索。
1、第 13 期2023 年 7 月无线互联科技Wireless Internet TechnologyNo.13July,2023基金项目:吉林省科技发展计划项目;项目名称:基于数据挖掘技术的全基因组选择方法研发及云计算平台体系构建;项目编号:YDZJ202201ZYTS692。作者简介:杜宝侠(1998),男,山东泰安人,硕士研究生;研究方向:计算机视觉。通信作者:唐友(1979),男,黑龙江龙江人,教授,博士;研究方向:生物信息学,农业信息化。基于改进 YOLOv8 的苹果检测方法杜宝侠1,2,唐 友1,2,辛 鹏1,杨 牧3(1.吉林化工学院,吉林 吉林 132022;2.吉林农业科技学院
2、,吉林 吉林 132101;3.一汽东机工减振器有限公司,吉林 长春 130001)摘要:实现苹果自动检测对推动苹果生产管理自动化、智能化有着重要意义。为了解决当前苹果检测方法准确率低、鲁棒性差等问题,文章提出了一种基于改进 YOLOv8 算法的苹果检测模型,通过引入GAM 注意力机制提升模型的检测精度。在苹果检测数据集上进行验证,基于改进的 YOLOv8 算法和原始 YOLOv8 算法相比,mAP 0.5 提高了 1.7%,mAP 0.5 0.95 提高了 2.2%。实验结果表明,文章提出的改进 YOLOv8 算法更能满足实际情况中对苹果检测的要求。关键词:苹果检测;YOLOv8;注意力机制
3、中图分类号:S661.1;TP391.41 文献标志码:A0 引言 我国是农业大国,水果生产和消费数量在世界上位居前列,在众多水果中,苹果的种植面积和产量均超过世界总量的 50%,均居世界首位1。苹果生产是我国农业经济发展的重要支柱,但我国的大部分苹果生产还处于传统的农业模式阶段,在苹果生产管理过程中需要耗费大量的人力物力,这也导致了生产效率的低下和农民收入水平的不稳定。因此,推动苹果生产过程的自动化、智能化发展具有重要意义。近年来,现代农业结合计算机视觉技术的各种智能设备在农业生产中的应用日益普及,并且成为农业领域的研究热点。这些智能设备的应用极大地提高了农业生产效率和精度,减少了对劳动力和
4、资源的依赖,并降低了农业生产成本,促进了农业的可持续发展。具体到苹果的生产方面,计算机视觉技术可以通过拍摄的图片或视频进行产量预测、病虫害识别,也可以通过图像信息对苹果果实进行优劣分级等,这些技术极大地推动了苹果生产管理的智能化发展。其中,利用目标检测技术对苹果果实进行识别和定位,从而帮助智能机器人实现自动采摘是一个重要的研究方向。在对苹果的检测方面,可以分为传统算法和基于深度学习的算法两类。传统算法大多依赖于目标的颜色、形状等外部特征来区分目标和背景2,存在特征提取困难、模型泛化能力差、在环境变化时性能下降严重等问题。近年来,基于卷积神经网络的深度学习技术在目标检测领域取得了显著的成功,相较
5、于传统的机器学习方法,基于深度学习的目标检测技术场景适应性强,精度更高。牟其松3简化了 YOLOv3 的主干网络,并通过改进损失函数,提高了苹果检测的精度;张中华等4提出了一种基于优化 FCOS 网络的绿色苹果检测模型,通过改进特征融合 FPN 提高了对绿色苹果的检测精度;Meili 等5针对复杂环境下的小苹果提出了一种平衡特征金字塔网络 BFP Net。上述研究通过对先进目标检测算法进行改进,增强其检测苹果的能力,但仍存在模型较复杂、检测速度慢、不容易部署等问题。在实际的果园场景中,要实现苹果的实时检测,不仅需要较好的检测精度,对检测的速度也有较高的要求。因此,本文以单阶段目标检测算法中最先
6、进的YOLOv8 模型为基础并加以改进,来实现苹果果实的自动检测。1 YOLOv8 模型原理1.1 YOLOv8 模型结构 YOLOv8 是 YOLO 系列最新的模型,具有非常优秀的检测精度和速度。根据网络的深度与特征图的宽度大小,YOLOv8 算法分为:YOLOv8-n、YOLOv8-s、YOLOv8-m、YOLOv8-l、和 YOLOv8-x 5 个版本。按911第 13 期2023 年 7 月无线互联科技研究创新No.13July,2023照网络结构图,YOLOv8 可分为:Input、Backbone、Neck和 Head 4 部分。其中,Input 输入端负责将输入图片缩放到训练需要
7、的尺寸,并包含缩放、改变图片色调和 Mosaic 数据增强等数据增强操作;Backbone 主干网络用来进行目标特征的提取,由卷积模块 Conv、C2f 结构和 YOLOv5 中使用的 SPPF 模块构成;Neck用来将不同维度的特征进行加强融合,其结构遵循特征金字塔(Feature Pyramid Network,FPN)和路径聚合结构(Path Aggregation Network,PAN),并删除了YOLOv5 上采样阶段的卷积操作;Head 部分将加强后的特征进行计算,最终得到不同目标的置信度和位置。考虑到模型检测的速度和精度,本次实验以检测速度最快的 YOLOv8-n 为基线模型,
8、并在此基础上加以改进。1.2 数据增强 数据增强是在不改变图像重要信息的前提下,基于有限的数据生成更多同样有效的数据的方法。可以极大地丰富训练数据的多样性,从而使得训练后的模型具有更强的泛化能力。改变图片的颜色和形状是最基础和常见的数据增强方式,在本研究中,使用随机改变图片的色调、饱和度、明亮度,同时对图片进行随机缩放和平移这些传统的数据增强方式。除了这些基础的数据增强方式外,有些研究还提出了更高效的数据增强方式,如 Mosaic 等6。Mosaic 数据增强方法的主要思想是将 4 张图片随机裁剪缩放,再拼接到一张图上作为训练数据。在本次实验中使用传统数据增强和 Mosaic 方法相结合的数据
9、增强方式。2 YOLOv8 模型改进方法2.1 GAM 注意力机制原理 注意力机制可以赋予空间中不同通道或区域以不同的权重,从而帮助模型专注于更重要信息的提取。全局注意力机制(Global Attention Mechanism,GAM)7,可以通过减少信息缩减和放大全局交互表示来提高深度神经网络的性能。该机制使用了通道-空间注意机制,在通道层面,GAM 首先将输入特征图进行维度转换,接着输入到 MLP 恢复原来的维度,最后通过 Sigmoid 输出。在空间层面,GAM 通过一系列的卷积处理再送入 Sigmoid 输出,最终实现两个层面注意力作用的叠加。GAM 的整体模块如图 1 所示。图 1
10、 GAM 注意力机制原理2.2 改进的模型结构 在 YOLOv8 模型的改进方面,将 GAM 注意力添加在 Neck 和 Head 的连接部分,引入的 GAM 注意力模块可以对通道和空间维度中的特征图信息进行自适应学习,并对特征进行重新拟合和分配,帮助模型更聚焦于苹果目标,提高了特征图中小目标的权重占比,从而加强了模型对其特征的训练。最终改进的YOLOv8 网络模型如图 2 所示。3 实验结果与分析3.1 数据集本实验使用的数据集来源为 https:/ 张。其中,训练集、验证集和测试集的图像数量分别为 273 张、14 张和 10 张。如图 3 所示为数据集示例。3.2 实验环境 本文实验平台
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 改进 YOLOv8 苹果 检测 方法
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。