基于YOLO算法的无人超市商品图像识别研究.pdf
《基于YOLO算法的无人超市商品图像识别研究.pdf》由会员分享,可在线阅读,更多相关《基于YOLO算法的无人超市商品图像识别研究.pdf(6页珍藏版)》请在咨信网上搜索。
1、第55卷第2 期2023年3月智能物联技术Technology of IoT&AlVol.55,No.2Mar.,2023智能与算法基于YOLO算法的无人超市商品图像识别研究刘思阳,张全(沈阳工业大学,辽宁沈阳1 1 0 8 7 0)摘要:商品识别是无人超市管理的重要环节之一。为提升商品识别速度与精度,本文提出了一种基于YOLOv5模型的改进方法。首先,拍摄不同种类的商品并采用数据增强方式丰富样本数据集;其次,在算法中添加注意力机制来解决特征提取时无注意力偏好问题,从而提升检测准确度;最后,通过在骨干段中将普通卷积网络替换成Chost卷积网络,降低网络参数带来的计算负担,进而提高目标识别速度。
2、实验结果表明,在相同训练条件下,相比原始YOLOv5网络,改进YOLOv5网络的识别准确率达到9 1.1%,比原模型提升了2.8%;mAP0.5达到了9 9.1%,比原模型提升了6.7%;识别速度达到了42.3FPS,提升了2.5FPS。关键词:无人超市;商品识别;注意力机制;Ghost卷积网络;YOLO算法【中图分类号】TP391.41;TP18【文献标识码】A【文章编号】2 0 9 6-6 0 59(2 0 2 3)0 2-0 2 4-0 6Research on Commodity Image Recognition of UnmannedSupermarket Based on YOL
3、O AlgorithmLIU Siyang,ZHANG Quan(Shenyang University of Technology,Shenyang 110870,China)Abstract:Commodity identification is one of the important links of unmanned supermarket management.In order toimprove the speed and accuracy of commodity identification,this study proposed an improved method bas
4、ed on YOLOv5model.Firstly,different kinds of commodities are photographed and the sample data set is enriched by data enhancement.Secondly,an attention mechanism is added to the algorithm to solve the problem of no attention preference in feature ex-traction,so as to improve the detection accuracy.F
5、inally,by replacing the common convolutional network with Ghost convo-lutional network in the backbone segment,the computational burden brought by network parameters is reduced,and thetarget recognition speed is improved.The experimental results show that,under the same training conditions,compared
6、withthe original YOLOv5 network,the accuracy of the improved YOLOv5 network reaches 91.1%,which is 2.8%higher thanthe original model,mAP0.5 reached 99.1%,increase by 6.7%.The detection speed reached 42.3 FPS,2.5 FPS is added.Key words:unmanned supermarket;commodity identification;attention mechanism
7、;ghost convolutional network;YOLO algorithm作。与传统超市的经营模式相比,无人超市可以保0引言持全天性营业,且只需少量的人工成本支出,可以无人超市的发展是现代城市智能的一种体现。实现更高的利润,可谓是一举多得。在无人超市中,无人超市指的是在超市里没有店员对顾客进行服商品的种类高达几十或上百种,商品识别作为核心务,顾客通过自助的方式来完成购物和付款等操技术发挥着重要作用。将此项技术应用到无人超市收稿日期:2 0 2 3-0 2-1 3作者简介:刘思阳(1 9 9 8-),男,辽宁本溪人,硕士研究生,研究方向:人工智能。张全(1 9 6 7-),男,辽宁沈
8、阳人,博士研究生,教授,研究方向:人工智能、设备状态评估。24刘思阳,张全:基于YOLO算法的无人超市商品图像识别研究中,可以加快商品的售卖速度,节约顾客的时间,让顾客的体验感更好。所以,实现高效率和高精确度的商品识别对无人超市的发展至关重要。在传统的商品识别方法中,超市人很多的情况下,采用人工结算的方式速度较慢,会导致顾客的体验感很差。RFID2方式是通过向商品上粘贴RFID标签来进行识别,但是其有一定的成本,特别是对一些利润率低的商品,利用RFID进行识别不现实。近年来,随着深度学习技术研究的不断深人,基于图像识别的商品识别在实际应用中也越来越多。2 0 1 8 年,梅散成等 3运用深度学
9、习中的AlexNet神经网络模型,通过商品图像预处理以及数据增强等方式扩充数据集,再利用随机梯度下降法(St o c h a s t ic G r a d ie n t D e s c e n t,SG D)进行模型算法优化,生成对50 种常用商品图像的识别模型。结果表明,该模型对商品图像的分类识别有较好的效果。2 0 2 0 年,李秀利4为提高分类后相似度较高商品的识别准确率,通过实验对比了不同位数哈希码的深度哈希图像搜索与细粒度图像搜索方法SC-DA(Selective Convolutional Descriptor Aggregation)识别的准确率,结果显示细粒度图像搜索方法对类别
10、之间差异性较小的商品图像识别效果较好,在RPC数据集结算图中的系统测试精度为9 7.6%。2021年,闫新艳等 5提出将深度残差收缩网络应用到商品图像识别,该算法模型主要以深度残差网络为主结构,然后将软阈值函数及注意力机制融人网络模型中。其中,软阈值函数可实现将通过注意力机制注意到的不重要的特征置为0,进而提高商品图像识别的准确率。实验对包含了51 种商品的数据集进行训练。结果表明,深度残差收缩网络不仅可以提高商品图像识别准确率,同时还提高了模型的运行速度。随着YOLO系列算法的迭代,YOLOv5已具有较好的工程实用性。因此,为了提高无人超市中商品识别的性能,本文针对YOLOv5网络进行改进研
11、究。首先,在YOLOv5框架中加人注意力机制,将不需要识别信息的干扰降到最低,进而突出关键信息,抑制无效特征,达到提高商品图像识别准确率的效果;其次,将骨干段原始卷积模块替换为Chost卷积,Ghost卷积对提高检测速度有显著效果,同时在一定程度上减少模型的参数量;最后,通过对比实验验证模型的性能。1基于改进YOLOv5的商品图像识别方法1.1CBAM注意力机制对于无人超市环境下的商品检测来说,商品的种类多,难度大,需要检测算法对商品特征有更高的分辨力。注意力机制的核心是让卷积神经网络更多关注图像中重要的部分,而不是对图像中所有物体都进行关注。为解决以上问题,本文引入了CBAM(Convolu
12、tional Block Attention Module)注意力模块,将其加入到原模型骨干段中第九层与第十层之间,以有效地将空间坐标信息整合到生成的注意图中。引入后的特征图如图1 所示。CBAM注意力模块包括通道注意力和空间注意力。通道注意力的主要作用是分配好特征通道和特征图之间的联系,并对二者进行注意力分配增强;空间注意力的主要作用是将神经网络的权重更多地放在图像分类过程中起决定性作用的像素区而忽略掉其他无关影响的区域。CBAM通过从通道和空间两个作用域出发,引人两个维度,进而实现改善模型性能的效果。其基本结构如图2 所示。InputFocusConvC3ConvC3C3Figure 1
13、Backbone structure after the introduction of CBAM attention mechanismSPPCBAM图1 引入CBAM注意力机制后的骨干段结构图ConvC3Conv25智能物联技术1.2Ghost 卷积CAM替换Ghost卷积后的骨干段结构图如图5所SAM示。传统卷积和Ghost卷积操作分别如图6 和图7所示。Ghost卷积的工作原理是使用传统卷积生成输人特征F输出特征F图2CBAM的结构模型Figure 2 Structure model of CBAMCAM(Channel Attention Module)处理过程如图3所示,全局最大池
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 YOLO 算法 无人 超市 商品 图像 识别 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。