基于轻量级YOLO-v4模型的变电站数字仪表检测识别.pdf
《基于轻量级YOLO-v4模型的变电站数字仪表检测识别.pdf》由会员分享,可在线阅读,更多相关《基于轻量级YOLO-v4模型的变电站数字仪表检测识别.pdf(11页珍藏版)》请在咨信网上搜索。
1、文章编号:0258-2724(2024)01-0070-11DOI:10.3969/j.issn.0258-2724.20210544专栏:轨道交通车辆与建筑环境控制、安全及节能基于轻量级 YOLO-v4 模型的变电站数字仪表检测识别华泽玺1,施会斌1,罗彦2,张子原1,李威龙3,4,唐永川5(1.西南交通大学信息科学与技术学院,四川成都611756;2.成都铁路局集团公司成都动车段,四川成都610051;3.西南交通大学电气工程学院,四川成都611756;4.强华时代(成都)科技有限公司,成都610000;5.重庆大学大数据与软件学院,重庆401331)摘要:为了在变电站实际场景中准确获取数
2、字仪表读数,智能管控变电站的安全风险,同时推动变电站智能化发展,以实际场景中变电站数字仪表作为研究对象,综合考虑实时性及准确度等,提出一种基于轻量级 YOLO-v4 模型的变电站数字仪表检测识别方法.首先,通过从鄂尔多斯变电站实际拍摄变电站数字仪表图像数据,使用Albumentations 框架对数字仪表图像进行数据扩充,构建变电站数字仪表目标检测数据集;然后,以 YOLO-v4 网络为基础,结合注意力机制构建一个有效通道注意(efficientchannelattention,ECA)改进的深度可分离卷积模块(ECA-bneck-m);最后,提出一个轻量级 YOLO-v4 模型,进行模型大小
3、与性能的对比实验.实验结果表明:本文方法可以在几乎不损失检测准确度的情况下,将整个模型存储大小压缩为原先的 1/5,同时将模型推理速度从24.0 帧/s 提升至 36.9 帧/s,其实时性能够满足实际变电站检测识别的工程需要.关键词:数字仪表;检测识别;YOLO-v4;数据增强;轻量化中图分类号:TP391.41;TP183文献标志码:ADetection and Recognition of Digital Instruments Based onLightweight YOLO-v4 Model at SubstationsHUA Zexi1,SHI Huibin1,LUO Yan2,ZH
4、ANG Ziyuan1,LI Weilong3,4,TANG Yongchuan5(1.SchoolofInformationScienceandTechnology,SouthwestJiaotongUniversity,Chengdu611756,China;2.ChengduRail-wayBureauGroupCorporationChengduBulletTrainSection,Chengdu610051,China;3.SchoolofElectricalEngineering,Southwest Jiaotong University,Chengdu 611756,China;
5、4.Qianghua Times(Chengdu)Technology Co.,Ltd.,Chengdu610000,China;5.SchoolofBigDataandSoftwareEngineering,ChongqingUniversity,Chongqing401331,China)Abstract:Inordertoaccuratelyrecognizethereadingsofdigitalinstrumentsintheactualsceneofsubstations,intelligentlycontrolsubstationsecurity,andpromoteitsint
6、elligentdevelopment,thedigitalinstrumentsinthesubstationaretakenastheresearchobject,andinviewofreal-timeandaccuracy,alightweightYOLO-v4modelisproposedforthedetectionandrecognitionofdigitalinstruments.Firstly,thedigitalinstrumentimagescapturedfromtheOrdossubstationareexpandedbyusingtheAlbumentationsf
7、ramework,thusbuildinganeffectivedigitalinstrumentdatasetfordetectionandrecognition.Afterthat,anefficientchannelattention(ECA)-baseddeep separable convolution block(ECA-bneck-m)is constructed with attention mechanism,and further alightweightYOLO-v4modelisproposedtoconductcomparativeexperimentsonmodel
8、sizeandperformance.Finally,experimentscomparingmodelsizeandperformanceareperformed.Theresultsshowthat,thestoragesize of the model can be compressed by about 5 times nearly without loss of detection accuracy,and theprocessingspeedofmodelcanbeincreasedfrom24.0frame/sto36.9frame/s,indicatingthattheprop
9、osedmodel收稿日期:2021-07-08修回日期:2021-09-30网络首发日期:2021-10-27基金项目:国家重点研发计划(2020YFB1711902)第一作者:华泽玺(1968),男,副教授,博士,研究方向为轨道交通智慧运维、传感器与智能检测、监测,E-mail:引文格式:华泽玺,施会斌,罗彦,等.基于轻量级 YOLO-v4 模型的变电站数字仪表检测识别J.西南交通大学学报,2024,59(1):70-80HUAZexi,SHIHuibin,LUOYan,etal.Detectionandrecognitionofdigitalinstrumentsbasedonlight
10、weightYOLO-v4modelatsubstationsJ.JournalofSouthwestJiaotongUniversity,2024,59(1):70-80第59卷第1期西南交通大学学报Vol.59No.12024年2月JOURNALOFSOUTHWESTJIAOTONGUNIVERSITYFeb.2024canmeettherequirementsofreal-timedetectionandrecognitionintheactualsubstation.Key words:digitalinstrument;detectionandrecognition;YOLO-v4;
11、dataaugmentation;lightweight数字式仪表具有读数准确方便、测量速度快、能提供数字信号输出、方便进行目视观察和数字记录等优点,已被广泛应用到变电站、工业、军事、航空等领域.然而,在实际应用中,由于技术限制和各类其他原因,变电站中一些数字仪表的数据读取和记录始终依靠人工观察.但是,人工观察在整个工作过程中存在手动工作量大、实时性差、效率低等问题.对变电站数字仪表数据进行智能化监测和管理能有效增强实时性,减少安全隐患.随着变电站智能化发展,人工采集已不能满足变电站对数据实时性的需求,对变电站数字仪表数据的实时处理已成为当前重要研究问题之一.近年来,相关研究人员提出使用计算机
12、视觉处理技术实现变电站数字仪表数据读取,这类方法大多先使用相机获取图像,再运用数字图像处理相关技术获取数字仪表读数,进而完成识别任务.数字仪表读数识别采用的方法有支持向量机、神经网络、模板匹配、穿针引线法等.Cui 等1提出一种数字仪表数字识别方法,采用基于方向梯度直方图的线性支持向量机,其拥有较好的精确度以及鲁棒性,但不适用于大样本数据的处理;卜令正等2提出一种改进的卷积神经网络(CNN)实现手写数字与数码管数字的识别,具有较快的检测速度,但是有一定精度损失;郭兰英等3提出一种基于可变形CNN 的数显仪表示数分割与识别方法,准确率高,但是检测速率相对较慢;陈刚等4提出一种基于特征提取的数字仪
13、表数码快速直接识别算法,能够快速识别字符,但其在复杂环境中鲁棒性较差;郭爽5采用穿线法对数字仪表进行识别,有较好的识别效果,但是依赖简单的识别环境;高菊等6在模板匹配的基础上,通过增加对字符特征的匹配,减少对相近字符的误判,适用于某一种类型仪表的数字识别,但对不同字体、不同倾斜程度的数字字符识别效果不佳,且模板匹配法容易遭受噪声影响.近年来,随着计算机视觉技术发展迅速,深度学习的方法在图像目标检测领域中应用愈加广泛.2014 年提出的基于区域的 CNN(RCNN)7、2015 年提出的全卷积网络(FCN)8-9以及 2015 年提出的FasterRCNN10-11等标志着计算机视觉领域目标检测
14、的巨大进步.与此同时,YouOnlyLookOnce(YOLO)系列算法也相继被提出,包括 2015 年YOLO-v112、2016 年 YOLO-v213、2017 年 YOLO-900014、2018 年 YOLO-v315、2019 年YOLO-v416以及 YOLO-v517.YOLO-v4 作为检测速率与精确度并肩的检测算法,已经在各个行业被广泛应用,如煤矸石检测18、人体检测19、安全帽检测20等.相比于其他深度学习目标检测模型,YOLO-v4 模型可兼顾检测性能和预测速度,能满足大部分实际检测任务的实时性需求.尽管 YOLO-v4 模型的计算效率已大大提高,但对于变电站数字仪表的
15、智能监测这一实际应用而言,其实时性和存储复杂度仍有待进一步改进.针对深度学习模型的轻量化问题,常用的轻量级网络为MobileNet 系列模型,包括 2017 年 Howard 提出的MobileNet-v121、2018 年 MobileNet-v222、2019 年MobileNet-v323等.该系列模型中构建的深度可分离卷积模块能在低参数量的情况下有效提取特征,但也存在非线性能力不足、模型压缩程度有限等问题.针对上述问题,面向变电站数字仪表检测识别的实际应用需求,本文提出一种基于轻量级 YOLO-v4 模型的数字仪表检测识别方法,在几乎不损失模型准确度的同时,有效降低整个模型的计算和存储
16、复杂度.主要工作包括以下 3 个部分:1)考虑到传统深度可分离卷积模块存在的非线性能力不足、压缩程度有限等问题,本文结合非线性拟合能力更强的 Mish 函数,提出轻量级网络模块 bneck-m.进一步,结合有效通道注意力(ECA)模块,构建 ECA 改进的 bneck-m(ECA-bneck-m)模块,有效提高其非线性处理能力和计算效率.2)考虑到传统 YOLO-v4 模型无法满足实际场景中变电站数字仪表检测识别的实时性和低存储复杂度需求,基于 ECA-bneck-m 模块,本文提出一种轻量级 YOLO-v4 模型,在几乎不损失模型检测准确度的前提下,提升模型的推理速度.3)从鄂尔多斯变电站实
17、际场景中采集数字仪表图像,并使用 Albumentations 框架对图像进行弹性变化、旋转、色彩空间变换等方式的数据增强,构建一个数据量充足、能较为全面反映变电站数字仪表可能情况的数字仪表检测识别数据集.第1期华泽玺,等:基于轻量级 YOLO-v4 模型的变电站数字仪表检测识别71 1 深度学习数字仪表检测识别方法 1.1 总体研究思路面向变电站实际场景中对数字仪表检测识别实时性和准确性的应用要求,以鄂尔多斯变电站采集的数字仪表图像作为研究对象,基于由特征提取网络以及路径聚合网络(PANet)组成的轻量级 YOLO-v4 网络,提出深度学习数字仪表检测识别方法,其总体框架如图 1 所示,主要
18、包括数字仪表预处理、数字仪表数据集构建、用于数字仪表目标检测以及数字字符识别的轻量级 YOLO-v4 模型、数字仪表检测识别等部分.轻量级 YOLO-v4特征提取网络PANet预测框类别置信度读数:242.2 244.4 243.2数字仪表预处理伽马变换仪表图像增强轻量级 YOLO-v4特征提取网络PANet预测框类别置信度仪表提取数据集构建数字仪表检测数显区域定位字符定位及识别图1深度学习数字仪表检测识别方法总体框架Fig.1Generalframeworkofdeeplearning-basedmethodfordetectionandrecognitionofdigitalinstrum
19、ents 1.2 基于轻量级 YOLO-v4 的数字仪表检测算法类似于传统自然图像目标检测,最简单的变电站数字仪表检测方法为模板匹配.1.2.1模板匹配模板匹配是在一幅图像中寻找与另一幅模板图像相似部分的技术24.该方法通过目标图像在待匹配图像中进行遍历,选择一定的匹配方式得到每个起始像素点的匹配度,匹配度最高的位置就是候选匹配位置,达到匹配查找的效果,如图 2 所示.图中,T(m,n)为模板图像,A(u,v)为待识别图像,(m,n)为模板图像像素点坐标,u、v 分别为待识别图像的宽、高.AijAij通过将模板图像在待识别图像上进行平移,被模板覆盖的搜索区域为子图(m,n),i、j 为子图左上
20、角坐标,i1,uM,j1,vN,M、N 分别为模板图像的宽、高.T(m,n)和(m,n)间的误差值为D(i,j),如式(1)所示.误差值越小,则匹配度越高,相似性越高.尽管这种方法计算量小,且检测速度快,但其鲁棒性较差,在复杂环境下并不适用.D(i,j)=Mm=1Nn=1Aij(m,n)T(m,n)2.(1)模板待识别图T(m,n)A(u,v)图2模板匹配方式示意Fig.2Illustrationoftemplatematching1.2.2轻量级 YOLO-v4 模型YOLO-v4 的算法框架由主干特征提取网络(CSPDarknet-53)、空间金字塔池化(SPP)和 PANet构成,如图
21、3 所示.面向变电站数字仪表检测识别,本文结合 Mish函数和注意力机制,提出一种轻量级YOLO-v4模型,包含4个改进思路:72西南交通大学学报第59卷主干特征提取网络CSPDarknet-53Resblock_body(208,208,64)*1Resblock_body(104,104,128)*2Resblock_body(52,52,256)*8Resblock_body(26,26,512)*8Resblock_body(13,13,1 024)*4空间金字塔池化PANet主干特征提取的特征4 种尺度最大池化拼接 4 种尺度特征DarknetConv2D_BN_Mish(416,4
22、16,32)图3YOLO-v4 模型框架Fig.3FrameworkofYOLO-v4model1)bneck 是一种特殊的深度可分离卷积模块,能有效提取目标的特征信息,且拥有较少的参数量.如图 4 所示,bneck 由 33 深度可分离卷积(Dwise)、SE(squeeze-and-excitation)通道注意力机制和残差连接结构构成.图中:NL 代表非线性激活函数,Pool 为池化处理,FC 为全连接层,ReLU 与 Hard-(为 Sigmoid 函数)为激活函数,+表示残差连接,Dwise 用于提取图像特征,SE 通道注意力用于提高特征的表达能力,残差连接结构用于解决由于网络层数过
23、深而产生过拟合的问题.1 1NL3 3Dwise,NLPoolFC,ReLUSE 通道注意力机制FC,Hard-1 1+残差连接图4bneck 模块示意Fig.4Structureofbneckmodulebneck 模块采用 H-Swish 函数作为模型的激活函数,使用光滑的激活函数的模型拥有较好的性能25.H-Swish、Mish 函数曲线如图 5 所示,图中,x 为函数自变量.可以看出,H-Swish 函数存在拐点,Mish 函数呈现为光滑曲线.因此,选用 Mish 函数作为激活函数,提出改进的深度可分离卷积模块bneck-m,提高整个模块的特征提取能力.10864205.0 2.502
24、.55.07.5 10.0 xx(a)H-Swish 函数10864205.0 2.502.55.07.5 10.0(b)Mish 函数函数值函数值10.07.510.07.5图5H-Swish 函数和 Mish 函数曲线Fig.5H-SwishandMishfunctioncurves基于上述分析,所提出 bneck-m 模块结构与图 4相同,由逆残差结构、深度可分离卷积结构和 SE 注意力模块构成,在提高模块非线性能力的同时,自适应地从特征的通道维度学习有用特征信息,同时抑第1期华泽玺,等:基于轻量级 YOLO-v4 模型的变电站数字仪表检测识别73制干扰信息.esss2)在 1)基础上,
25、为进一步降低 bneck-m 模块参数量,且提高其计算效率,结合 ECA 模块,将 SE 模块(图 6)替换为 ECA 模块(图 7),提出如图 8 所示的 ECA-bneck-m 模块.图 6 中:e 为输入特征,HWC 为通道维度.SE 模块对每个特征通道单独使用全局平均池化(GAP),然后使用 2 个 FC 层,最后,使用 Hard-函数生成通道权值,将通道权重与原特征相乘,获得输出特征.其中,FC 层的设计是为了捕捉非线性的跨通道交互,并通过降维控制其复杂性.如图 7 所示,ECA 模块先对每个通道单独全局平均池化,然后,通过考虑每个通道及其个邻居来捕获局部跨通道交互信息,即使用个 1
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 轻量级 YOLO v4 模型 变电站 数字 仪表 检测 识别
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。