识别安全帽佩戴的轻量化网络模型_胡文骏.pdf
《识别安全帽佩戴的轻量化网络模型_胡文骏.pdf》由会员分享,可在线阅读,更多相关《识别安全帽佩戴的轻量化网络模型_胡文骏.pdf(7页珍藏版)》请在咨信网上搜索。
1、2023,59(13)在工地安全管理中,安全帽佩戴是一个很重要的方面,安全帽能够有效地减少高空坠物和打击碰撞的伤害。在施工过程中,会出现施工人员不戴安全帽、有非施工人员闯入工地等情况,这些都会对施工安全造成一定的影响,在施工过程中对安全帽佩戴行为进行实时,准确的监管是很重要的环节。目前,主要还是以人工的方式去对安全帽佩戴行为进行监管,这样做是一件很耗时、耗人力的事,存在人力资源浪费的问题。同时监管人员可能疏忽或者监管不严,会带来一定的安全隐患。采取基于深度学习的目标检测算法来对安全佩戴行为进行检测,可以对工地安全进行更准确、更实时的监管,同时还可以节省人力资源,提高监管效率。近些年来,神经卷积
2、网络发展迅速,在目标检测领域取得不少进步,比如YOLOv41、SSD2等one stage的目标检测算法,取得了精度和速度的平衡,比 FasterRCNN、R-CNN、Fast R-CNN3-5等two stage目标检测算识别安全帽佩戴的轻量化网络模型胡文骏,杨莉琼,肖宇峰,何宏森西南科技大学 信息工程学院,四川 绵阳 621010摘要:安全帽佩戴识别是一种分类少的目标检测任务,使用现有精度较高的大型深度学习网络模型来识别安全帽佩戴,存在参数冗余问题且计算较大,不利于部署在计算量有限的嵌入式设备中以适应实际的工地环境。针对以上问题,提出了一种适合部署在嵌入式设备中的轻量化网络模型YOLO-G
3、host-BiFPNs3。在YOLOv4的基础上,基于Ghost模块重构新的网络结构并对网络的深度和宽度进行裁剪;设计一种基于通道加权相加的轻量化模块BiFPNs3来替换原来计算量较大的FPN+PAN的结构;采用更容易量化的H-Swish激活函数;在Safety-Helmet-Wearing-Dataset数据集上进行实验,在测试集上,mAP0.5为91.1%,相较于YOLOv4精度仅损失1个百分点,比轻量化网络模型YOLOv4-Tiny精度高26个百分点。参数量为原来YOLOv4的3%,计算量仅为原来YOLOv4的5.8%。关键词:目标检测;轻量化网络模型;安全帽佩戴识别;Ghost模块文献
4、标志码:A中图分类号:TP391.4doi:10.3778/j.issn.1002-8331.2203-0357Lightweight Network Models and Applications for Identifying Helmet WearHU Wenjun,YANG Liqiong,XIAO Yufeng,HE HongsenSchool of Information Engineering,Southwest University of Science and Technology,Mianyang,Sichuan 621010,ChinaAbstract:Helmet we
5、aring recognition is a target detection task with less classification.The existing large-scale deeplearning network model with high accuracy is used to identify helmet wearing,which has problems of parameter redun-dancy and large calculation,which is not suitable for deployment in embedded devices w
6、ith limited computation to adaptto the actual site environment.To solve these problems,a lightweight network model YOLO-Ghost-BiFPNs3 suitable forembedded devices is proposed.On the basis of YOLOv4,a new network structure is reconstructed based on Ghost module,and the depth and width of the network
7、are trimmed.BiFPNs3,a lightweight module based on weighted channel addition,is designed to replace the FPN+PAN structure which has a large amount of calculation.A more quantifiable H-Swishactivation function is used.Experiments are carried out on the Safety-Helmet-Wearing-Dataset dataset.In the test
8、 set,mAP0.5 is 91.1%,which only loses 1 percentage point of accuracy compared with YOLOv4,and is 26 percentagepoints higher than the lightweight network model YOLOv4-Tiny.The number of parameters is 3%of that of YOLOv4,and the computational amount is only 5.8%of that of YOLOv4.Key words:target detec
9、tion;lightweight network model;helmet wearing identification;Ghost module基金项目:四川省重点研发项目(21ZDYF1254)。作者简介:胡文骏(1998),男,硕士研究生,主要研究方向为计算机视觉;杨莉琼(1980),通信作者,女,博士,副教授,主要研究方向为建筑安全管理、建筑信息化;肖宇峰(1978),男,博士,教授,主要研究方向为计算机视觉、人工智能;何宏森(1975),男,博士,教授,主要研究方向为信号处理、人机语音交互。收稿日期:2022-03-23修回日期:2022-05-11文章编号:1002-8331(20
10、23)13-0149-07Computer Engineering and Applications计算机工程与应用149Computer Engineering and Applications计算机工程与应用2023,59(13)法速度更快,能真正用在实时的应用中。但其网络规模、参数量、计算量仍然较大,需要较好的GPU才能有比较快的推理速度。在工地环境中,一方面是使用嵌入式设备能更好地适应工地环境6,但像YOLOv4这种计算量大的神经网络难以在嵌入式设备中运行;另一方面,在现实的情况中需要对不止一处同时进行安全帽佩戴检测,使用计算量大的神经网络会占用较多的GPU算力,会增加服务器的成本。安
11、全帽佩戴识别任务,分类数只有两个,盲目地增加网络的规模,不能大幅度提升识别精度,无法取得计算量和精度之间好的性价比。YOLOv4-Tiny7-9作为 YOLOv4 针对于嵌入,低端 GPU设备设计的轻量级卷积神经网络,由于颈部网络只保留大,中目标的检测尺度,虽然加快了检测速度,但也降低了安全帽佩戴头部这种小目标检测10-12的精度。2020年,Han等13提出了基于GHost模块的卷积神经网络,利用线性变化成更多的特征图,以很小的代价从原始特征中挖掘更多的特征信息,在效率上和准确度上高于只使用可分离卷积的轻量级神经网络。大型的精度高的网络结构在安全帽佩戴识别14任务中模型冗余,不利于部署在计算
12、量有限的嵌入式设备中。针对这个问题,本文在主流的目标识别算法YOLOv4的基础上,基于Ghsost模块重构新的主干特征提取网络,与大型网络相比,该网络的参数量和浮点数计算更少,而且精度损失少。同时对网络的通道数和深度进行裁剪进一步减少计算量,设计基于通道加权相加的 BiFPNs3 轻量化模块,来替代 YOLOv4 中的 FPN+PAN结构,该模块相对于FPN+PAN的结构通道数要少,推理速度更快,精度影响小;激活函数使用适合嵌入式设备中的hard-Swish激活函数,相对于YOLOv4的复杂的Mish激活更容易量化,更适合嵌入式设备;设计一种具有精度高、效率高,适合部署在计算资源有限的嵌入式设
13、备中的轻量级网络 YOLO-Ghost-BiFPNs3。在Safety-Helmet-Wearing-Dataset公开安全帽数据集测试结果表明,YOLO-Ghost-BiFPNs3安全帽佩戴检测具有较高的准确率和较快的推理速度,无论是精度还是速度都强于现有的轻量级网络模型YOLOv4-Tiny,对比原来的YOLOv4精度损失少,适合应用于实际的工地环境。1YOLO-Ghost-BiFPNs3YOLOv4目标识别算法作为YOLOv315的升级算法,在输入端采用mosaic数据增强16,提高了对于小目标的识别精度。特征提取网络在YOLOv3的Darkent53的基础上,融合交叉阶段部分连接的思想
14、,设计出计算复杂度小同时识别精度高的特征提取网络CSPDarkent5317。颈部网络采用FPN+PAN的结构,FPN自顶向下传递高层的语义信息,PAN自下而上传递低层的定位信息,有效缓解了深层网络丢失浅层网络的特征信息问题。引入SPP模块,融合不同的感受野,融合局部特征和全局特征,提高了对网络对于目标大小差异大情况下的识别效果。采取综合考虑了目标重叠面积、长框比、真实框和预测框中心距离的 CIOU-Loss 作为 Bouding box的损失函数,提高了识别精度。采用非极大值抑制算法(NMS)18-19。1.1Ghost模块特征图冗余是卷积神经网络的重要特点,特征图中会有很多类似或者冗余的特
15、征,这些冗余的特征可以基于某个基础特征通过线性的变换获得。Ghost模块通过常规卷积提取丰富的特征信息,对冗余特征信息采取廉价的线性变换生成,这样能够有效地节省模型所需的计算资源。图1表示标准卷积,图2表示Ghost模块,其中X表示廉价的线性操作,都会输出相同数量的特征图。假设每个基础特征有s个冗余特征,那么只需要输出n/s个基础特征就可以,接着对每个基础特征进行廉价的线性变换,生成对应的冗余特征。这样可以降低模型的计算量,GFLOPS是标准卷积的1/s。设线性操作部分采用的卷积核平均尺寸为dd,理论加速比率r,如式(1)所示,h和w为输出特征层的长和宽,k为标准卷积核尺寸,n为卷积和数目,c
16、为输入的通道数,若dd与kk相同,且sc,则理论上速度提升为原来的s倍。r=nhwckknshwckk+(s-1)nshwdd=ckk1sckk+s-1sddscs+c-1s(1)1.2BiFPNs3模块BiFPNs3如图3所示,其中用stride=2的深度可分离卷积实现下采样,不使用池化,减少信息损失。特征融合采用加权相加,不使用拼接的方式,BiFPNs3模块InputConvOutput图1标准卷积Fig.1Standard convolution图2Ghost模块Fig.2 Ghost moduleInputConvIdentityOutputx1x2x31502023,59(13)的P
17、6和P5尺度层的通道数由原来的FPN+PAN结构的256降低为128,这样可以提升模型的推理速度。相较于YOLOv4-Tiny的颈部网络而言,多了P4尺度层,在识别安全帽佩戴头部相对较小目标时,精度要高。1.3hard-Swish激活函数YOLOv4中有着大量的Mish激活函数,如式(2)所示,虽然其平滑的特性,具有更高的精度,但是由于thanh(ln(x+ex)量化较为复杂,不适合在计算资源有限的嵌入式的设备中运行。本文使用具有一定的平滑特性、计算量小、量化较为容易、适合部署在计算资源有限的嵌入式设备中的hard-Swish激活函数,如式(3)所示:Mish(x)=xthanh(ln(x+e
18、x)(2)Hard-Swish(x)=xReLU6(x+3)6(3)ReLU6(x)=min(max(0,x),6)(4)1.4YOLO-Ghost-BiFPNs3YOLO-Ghost-BiFPNs3网络结构如图 4所示,其中CBH 是使用了批量归一化(batch normalization,BN)和hard-Swish激活函数的步长为1的卷积层,CBH(s=2)中的卷积步长为2,用于下采样。图5中DWConv表示深度可分离卷积,Concat表示特征图拼接;图5中add表示特征图相加,maxpool表示最大值池化;图3中addwsGhostResUnitaddws上采样addwsGhostRe
19、sUnitaddws下采样下采样GhostResUnitGhostResUnitaddwsGhostResUnitaddws上采样GhostResUnitP6P5P4P6_tdP5_tdP4_tdP6_out1919128P5_out3838128P4_out7676128图3BiFPNs3网络结构Fig.3Network structure of BiFPNs3图4YOLO-Ghost-BiFPNs3网络结构Fig.4Network structure of YOLO-Ghost-BiFPNs3输入608608CSP_1GhostCSP_2GhostCSP_2CBHSPPGhostCSP_1
20、CBH767612876761283838256383812819191281919256BiFPNs3CBHP4P5P6 ConvCBH Conv ConvP4_outP5_outP6_out输出767621383821191921CBH(s=2)CBH(s=2)CBH(s=2)CBH(s=2)CBH(s=2)胡文骏,等:识别安全帽佩戴的轻量化网络模型151Computer Engineering and Applications计算机工程与应用2023,59(13)表示加权相加之后通过hard-Swish激活函数激活,其中W表示权重,通过训练得到,如式(5)所示:addws=hard-Sw
21、ish(iNwixi)(5)1.5Mosaic数据增强Mosaic数据增强是首先对4张进行随机缩放、随机裁剪、随机排布等操作,然后将其拼接起来,形成一张图片,这样能加强对小目标的检测效果。1.6损失函数YOLOv4的总损失函数为置信度损失函数loss1、分类损失函数loss2、边界框回归损失函数loss3之和。1.6.1置信度损失YOLOv4的置信度损失函数如式(6)所示,网格是SS个,每个网格产生B个候选框anchor box,每个候选框会经过网络得到相应的bounding box。loss1=i=0S2j=0BWobjijC?jilog(Cji)+(1-C?ji)log(1-Cji)-ln
22、oobji=0S2j=0B(1-Wobjij)C?jilog(Cji)+(1-C?ji)log(1-Cji)(6)Cji=Pi,jIOUtruthpred(7)Wobjij:表示第i个网格的第j个anchor box是否预测这个object,如果负责则为1。Cji:表示第i个网格中第j个边界框的置信度分数。Pi,j:用来判别是否为目标的函数(0/1)。C?ji:表示真实值,其取值是由网格的bounding box有没有负责预测某个对象决定的。如果负责,则为1;否则为0。1.6.2分类损失YOLOv4的分类损失函数如式(8)所示:loss2=i=0S2j=0BWobjijc=1Cp?ji(c)l
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 识别 安全帽 佩戴 量化 网络 模型 胡文骏
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。