基于改进的DeepLabv3p网络的轮胎胎面花纹缺陷分割算法.pdf
《基于改进的DeepLabv3p网络的轮胎胎面花纹缺陷分割算法.pdf》由会员分享,可在线阅读,更多相关《基于改进的DeepLabv3p网络的轮胎胎面花纹缺陷分割算法.pdf(4页珍藏版)》请在咨信网上搜索。
1、 2023 年第 8 期95计算机应用信息技术与信息化基于改进的 DeepLabv3p 网络的轮胎胎面花纹缺陷分割算法梁步超1 罗印升1 宋 伟1LIANG Buchao LUO Yinsheng SONG Wei 摘要 为了解决 DeepLabv3p 网络在检测汽车轮胎胎面花纹图像上呈现的边缘分割模糊、模型参数量大、训练速度慢等问题,提出了一种融合双重十字交叉注意力模块(URCCA)的轻量级图像分割算法DeepLabNLAS。首先,采用STDC2代替DeepLabv3p网络中的特征提取网络来降低模型的参数量和体积,提升模型的训练速度;然后,将 URCCA 模块与 ASPP(atous spa
2、tial pyramid pooling)模块并联来获取长距离密集的上下文信息;之后,将两个模块的特征图相融合送入解码器进行上采样恢复至输入图像的分辨率大小。实验结果表明,本文改进算法在语义分割公用数据集城市景观数据集 Cityscapes 以及本文数据集 Tread_pattern 上的效果都优于 DeepLabv3p 网络。在公用数据集 Cityscapes 上,DeepLabNLAS比 DeepLabv3p 网络和文献 9 的平均交并比分别提高了 1.22%和 2.68%,在数据集 Tread_pattern 上分别提高了 2.13%和 3.41%。关键词 DeepLabv3p;汽车胎面
3、花纹;STDC2;URCCAdoi:10.3969/j.issn.1672-9528.2023.08.0201.江苏理工学院 江苏常州 213001项目名称 基于3D 视觉和AI 技术的首胎检测系统研发(江苏省科技计划项目),项目编号:BY20221340 引言在汽车轮胎工业检测领域中应用深度学习理论是目前计算机视觉的研究热点。其中,2019 年,吴则举等人1针对轮胎缺陷检测算法速度与精度都不高的问题,使用 U-Net 网络对轮胎带束层区域存在的缺陷进行检测分割,并与传统的基于形态学的分割方法进行比较,证明了 U-Net 在速度与精度上的优越性。2021 年,李明达等人2针对轮胎图像背景复杂缺
4、陷难以区分的问题,使用 Faster-RCNN 网络,通过引入ROI Align 池化对轮胎表面的缺陷进行识别,减少了缺陷误判和漏判的情况。陈亮等人3针对在 X 光成像的轮胎图像上,使用传统深度学习算法检测效率低、精度差等问题,改进了Effi cient-Net 网络,使其融合了多级特征提取网络 TWFPN,并对 6 种轮胎缺陷类型图像进行了检测,并取得了较好的效果。2022 年,王鹏辉等人使用 YOLOv5 网络对轮胎表面的缺陷进行了检测,检测精度(mAP)为 65.4%,并与 YOLOv4网络和 Faster-RCNN 网络进行了对比证明了 YOLOv5 网络的有效性。语义分割作为深度学习
5、图像处理中非常重要的分支,被广泛应用于工业产品的缺陷分割,将其应用于轮胎胎面花纹缺陷识别领域,对比于人工检测或者传统的缺陷检测,检测效率更高,检测准确率也更高,能够有效地识别并且区分出轮胎胎面花纹存在的鼓泡、划痕以及花纹错位等缺陷。张达等人5对 PSPNet 网络进行了改进,采用 MoblieNet 网络来提取钢包底吹氩图像的特征,在网络中引用深度可分离卷积以及金字塔池化来融合特征信息,不仅提高了分割的精度,还减少了模型的计算量;邓天民等人6对 FCN 网络进行了改进,利用压缩后的 VGG16 进行特征图提取,像素点的聚类采用 DBSCAN 算法搭配逆透视变换,最后拟合车道线像素点采用最小二乘
6、法,得到了兼具实时性和准确性的车道线分割算法;任楚岚等人7针对新冠肺炎病毒,设计了一款分割网络,该网络是在经典网络Unet基础上与残差连接相结合,引用了分层分裂模块、坐标注意力、特征内容感知重组上采样来分割肺部的病变区域,提升了分割的精度;周倩倩等人8针对传统视觉算法在识别类型少、速度慢、准确率低等问题,实验对比了 Deeplabv3+采用不同骨干网络对排水管道进行缺陷检测的结果,得出特征提取网络采用 Resnet50 时,分割的精度要明显高于其他网络。刘文祥等人9针对在遥感图像上Deeplabv3+网络出现的拟合速度慢、边缘分割模糊等问题,以串并联两种方式将双注意力机制融入到了 Deepla
7、bv3+网络中,实验证明,并联方式对 Deeplabv3+网络存在问题的改善效果更好。DeepLabv3p 网络在语义分割领域应用广泛,同时存在一定的不足,比如模型体积大、训练速度慢、边缘分割精度低等。针对上述缺陷,本文对 DeepLabv3p 网络进行了2023 年第 8 期96计算机应用信息技术与信息化改进,将双重十字交叉注意力模块引入该网络,并采用轻量级的特征提取网络 STDC2,对轮胎胎面花纹进行缺陷分割。1 DeepLabv3p 网络2018 年,谷歌公司提出了 DeepLabv3p 网络10,该网络主要包含两个部分:编码器(Encoder)和解码器(Decoder)。Encoder
8、 主要是采用 Resnet50 对图像进行特征提取,提取到的特征图分为两个部分,低层次部分直接输送至 Decoder,高层次部分输送至 ASPP 模块进行多尺度特征信息的融合,再将融合后的特征图通过 11 的卷积进行降维,然后将降维后的特征图进行双线性插值 4 倍上采样与之前通过 11 卷积降维的低层次特征图进行拼接,最后,使用 33 的卷积和双线性插值将特征图恢复至输入图像的分辨率大小,得到最终的结果图。DeepLabv3p 网络的优点在于采用了空洞卷积,可以扩大感受野,提高分割的精度,编解码结构可以融合高低层次的特征信息,有利于边缘特征的恢复。DeepLabv3p 网络的整体结构如图 1
9、所示。图 1 DeepLabv3p 网络结构图2 改进的 DeepLabv3p 网络DeepLabv3p 网络作为语义分割领域中最为优秀的网络之一,在公用数据集 VOC、Cityscapes 上都取得了很好的效果。但是,针对本文的轮胎胎面花纹数据集 Tread_pattern,由于轮胎胎面花纹图像的背景色为黑色,缺陷也为黑色,对比度低难以区分,DeepLabv3p 网络表现得不是很好。另外,由于采集到的轮胎胎面花纹分辨率较高,DeepLabv3p 算法训练时,总参数量多达 2679 万个,参数量太大导致网络训练时间长,收敛慢。针对以上两个方面的问题,本文在 DeepLabv3p 网络中融合了双
10、重十字交叉注意力模块,并采用了轻量级特征提取网络 STDC2,将改进后的 DeepLabv3p 网络命名为 DeepNLAS。2.1 DeepNLAS 网络由于 Transformer11在自然语言处理(natural language processing,NLP)领域上取得了很大的成就,很多研究者开始研究将其最为核心的自注意力机制应用于计算机视觉领域。在语义分割任务中第一个使用自注意力机制的是 Non-local 模块12,它不仅能够扩大感受野,还能够增强远距离特征之间的联系,但是它也存在一定的不足,由于需要生成的注意力图很大,导致计算量太大,需要占用大量的GPU内存。Non-local
11、模块如图 2 所示。图 2 Non-local 模块在后续语义分割网络的发展中,基于注意力模块的网络有:DAnet13主要是融合了位置注意力机制和通道注意力机制来提取丰富上下文信息,增强了特征图任意两个位置之间的空间联系与通道联系。GCnet14主要对 Non-Local 模块进行了改进,借鉴了 SENet 中的 SE 模块,在充分利用全局上下文信息的同时大大地减少了 Non-Local 模块的计算量。这些网络都通过设计复杂的注意力模块来提高分割的精度,使得网络变得非常复杂。考虑到在保持分割精度高的同时降低网络的复杂度,2020 年,黄子龙、刘文予等人15提出了 CCnet 网络,该网络的十字
12、交叉注意力模块(criss-cross attention,CCA)主要是在 Non-Local 模块的基础上进行了改进,不仅能够高效地捕获长距离的密集的上下文信息,所需计算量也远远低于 Non-Local 模块。与 Non-Local 模块不同的地方在于 CCA 模块增加了 Affi nity 操作和 Aggregation 操作。Affi nity 操作就是对特征图上每个像素点提取其十字位置上的特征向量。Aggregation 操作就是将 V 任意位置上的像素点提取十字位置上的特征向量并与特征图 A 进行矩阵相乘。由于 CCA 对应的特征图呈现十字交叉稀疏形式,大大降低了计算的复杂度,No
13、n-Local 模块的计算量为 O(HW)(HW),而 CCA 的 计 算 量 只 有 O(HW)(H+W-1),提高了语义分割的精度和效率。图 3 所示为十字交叉注意力模块。图 3 Criss-Cross Attention 模块2.2 DeepNLAS 网络的整体结构为了加强十字交叉注意力模块与周围像素点的联系并将其应用于 DeepLabv3p 网络中,本文设计了 URCCA 模块。如图 4 所示,URCCA 模块先将提取到的特征图进行Reduction,然后连续使用两次 CCA 模块,再对特征图进行 2倍上采样,这样的操作能够获得全局的上下文信息,生成更加丰富且密切联系的特征。2023
14、年第 8 期97计算机应用信息技术与信息化图 4 URCCA 模块图 5 所示为 DeepNLAS 网络的整体结构图,DeepNLAS网络首先使用 STDC2 网络对轮胎胎面花纹图像进行特征提取,然后将提取到的特征图分为三个部分,分别记为 TP1、TP2、TP3。TP1 输送至 URCCA 模块,TP2 输送至 ASPP 模块,TP3 输送至解码器部分,将经过 URCCA 模块处理后的特征图与ASPP处理后的特征图使用相加操作进行特征融合,得到的特征图与经过卷积降维的 TP3 进行拼接融合操作,得到的特征图再次进行双线性插值四倍上采样恢复至与原图分辨率大小一致的输出结果图。图 5 DeepNL
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 改进 DeepLabv3p 网络 轮胎 花纹 缺陷 分割 算法
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。