基于多尺度和注意力机制的混合监督金属表面缺陷检测.pdf
《基于多尺度和注意力机制的混合监督金属表面缺陷检测.pdf》由会员分享,可在线阅读,更多相关《基于多尺度和注意力机制的混合监督金属表面缺陷检测.pdf(8页珍藏版)》请在咨信网上搜索。
1、DOI:10.11992/tis.202205042网络出版地址:https:/ 计算机与人工智能学院、阿里云大数据学院、软件学院,江苏 常州 213000)摘 要:针对缺陷检测中被检测样品中因缺陷目标形状各异引起的无法提取有效特征的问题,本文提出基于深度学习的缺陷检测模型。该模型使用改进后的多尺度特征融合模块,在控制计算量的基础上解决识别不同大小缺陷的问题。通过引入非局部注意力机制模块,模型对缺陷特征的提取能力得到加强;在训练中使用混合监督训练,探索模型所需要的标注量和检测准确度之间的关系。本文方法在 KSDD、KSDD2 和 STEEL 3 个数据集上都获得了比先进方法更好的精确度,对于不
2、同类型的缺陷都能提取到有判别力的特征。与先进的完全监督方法和无监督方法相比,在数据集上精确度平均提高 0.8%和 11%。关键词:缺陷;检测;特征提取;学习算法;学习系统;图像处理;金属;产品品质;深度学习中图分类号:TP391 文献标志码:A 文章编号:16734785(2023)04088608中文引用格式:孙博言,王洪元,刘乾,等.基于多尺度和注意力机制的混合监督金属表面缺陷检测 J.智能系统学报,2023,18(4):886893.英文引用格式:SUN Boyan,WANG Hongyuan,LIU Qian,et al.Hybrid supervised metal surface
3、defect detection based on multi-scale and attentionJ.CAAI transactions on intelligent systems,2023,18(4):886893.Hybrid supervised metal surface defect detectionbased on multi-scale and attentionSUN Boyan,WANG Hongyuan,LIU Qian,FENG Zundeng,TANG Ying(School of Compute Science and Artificial Intellige
4、nce/Aliyun School of Big Data/School of Software,Changzhou University,Changzhou 213000,China)Abstract:Aiming at the problem in defect detection that effective features cannot be extracted due to different shapes ofdefect targets in the detected samples,this paper presents a defect detection model ba
5、sed on deep learning,which uses animproved multi-scale feature fusion module to solve the problem of identifying defects of different sizes on the basis ofcontrolling the amount of calculation.By introducing a non-local attention mechanism module,the models ability ofextracting defect features is en
6、hanced.Furthermore,mixed-supervised training is used in training to explore the relation-ship between the amount of annotations required by the model and the detection accuracy.This method achieves betteraccuracy than the state-of-the-art methods on KSDD,KSDD2,and STEEL datasets,and can extract disc
7、riminative fea-tures for different types of defects.Compared with the state-of-the-art fully supervised and unsupervised methods,theaverage accuracy improvement on the dataset is 0.8%and 11%.Keywords:defect;detector;feature extraction;learnin galgorithm;learning system;image processing;metal;quality
8、 ofproduct;deep learning 产品质量检测作为工业生产中的重要一环 1-3。起初人们主要是利用传统机器学习算法对这一问题进行研究4-5。随着卷积神经网络(convolution-al neural networks,CNN)6等深度学习模型在计算机视觉领域的大规模应用,利用深度学习的方法进行缺陷检测也逐渐成为一个热门的研究方向。根据标注程度的不同,基于深度学习的缺陷检测可以分为 3 种:1)对全部数据进行图像级以及像素级标注(全监督学习),典型代表为以 CNN 为主干网络的方法7-10;2)对全部数据仅进行图像级标注(弱监督学习)11-13;3)对数据不进行任何标注(无监督
9、学习),主要以 VAEs(variational au-toencoders)14-16和 GANs(generative adversarialnets)17-18为主。此外 Bozic 等19利用混合监督训练对缺陷检测进行了研究。2014 年,人们开始了对注意力机制的研究并开始逐步扩展到不同的领域20-21。2017 年 Wang等22从机器翻译出发,将自注意力看作是一种非局部的平均值,从而将其转化为一般的非局部滤波操作,提出 Non-Local Block,从而适用于计算机图像问题当中;2019 年 Dong 等23将注意力机制引入到缺陷检测当中,提出一个基于金字塔特征融合和全局上下文注
10、意网络的表面缺陷检测方收稿日期:20220525.网络出版日期:20230323.基金项目:国家自然科学基金项目(61976028);2022 年江苏省研究生科研创新计划(KYCX22_3066).通信作者:王洪元.E-mail:.第 18 卷第 4 期智能系统学报Vol.18 No.42023 年 7 月CAAI Transactions on Intelligent SystemsJul.2023智能系统学报编辑部版权所有法PGA(pyramid feature fusion and global con-text attention network for automated surfa
11、ce defect de-tection)网络。但是这种方法更关注局部上下文的特征,面对较大的缺陷则效果很差。上述几种方法面对复杂的缺陷类型都略有不足,同时在精确度与样本标注量之间没有做到很好的平衡。基于此,本文提出一个融合了注意力机制的缺陷检测模型,并在其中加入了一个多尺度融合单元;将全监督学习和弱监督学习结合起来,对模型进行混合监督训练18,探索样本标注量对精确度的影响。本文的主要贡献如下:1)使用改进的多尺度特征融合模块,加强模型对不同形状的缺陷特征的提取能力并探索尺度对精确度的影响。2)融合 Non-Local Block 注意力机制单元,增强模型对于缺陷特征的识别能力,提高缺陷检测的
12、精确度。3)使用混合监督训练探索像素级标注数量对精确度的影响。1 多尺度注意力检测模型缺陷检测具有缺陷目标大小不一、特征表达能力弱、特征信息比较少等问题,针对上述问题,本文以保持低计算量并提高模型在缺陷特征的表达能力为目标进行一系列探索,主要进行了如下改进:1)改进了多尺度特征融合网络,在控制计算量的基础上,加强模型对于形状各异特征的提取能力。2)在网络中融入 Non-Local Block 注意力机制模块,优化网络中对特征的表达能力,丰富特征图中缺陷的特征信息。3)设计不同数量的像素级标注,利用混合监督训练探索标注级别对精确率的影响。1.1 缺陷检测模型22如图 1 所示,模型主要分为 2
13、个模块,分别为L1和 L2模块,其中 L1模块使用像素级数据进行训练,提高模型像素级的识别能力;L2模块则使用图像级数据进行训练,提高模型图像级的识别能力。网络架构细节如表 1 所示。对于一张输入图片,首先利用 L1模块 4 个卷积层提取图像特征,在每一层卷积层后设置的最大池化层,以减小图像的大小并保留更多的特征。相比于利用具有步长的卷积层降低图像大小,这种操作更有利于保留更多的特征。选取 L1模块第 1 层和最后一层输出的特征图送入多尺度特征融合模块进行进一步处理。此外最后一层卷积分别输出单通道和 1 024 通道的特征图,单通道的特征图将利用 Non-Local Block 对其进行特征加
14、强后与 1 024通道特征图进行映射连接形成一个 1 025 通道的特征图。经过注意力机制单元处理后的单通道特征图能够避免网络使用大量的特征图,减少对大量参数的过度拟合,同时加强模型对于缺陷特征的关注。利用 L2模块对输出的 1 025 通道的特征图进行操作并分别输出 2 个 32 通道的特征图。最后将这 2 个特征图与多尺度特征融合单元输出的 3 通道特征图进行映射连接送入全连接层,生成最终的分类。多尺度特征融合输出XSoftmax Xout+全局平均池化模块全局最大池化模块映射连接.非局部模块L2L1:卷积11g:卷积11最大池化 22W:卷积11BN:卷积11最大池化 22 图 1 网络
15、图Fig.1 Network diagram 第 4 期孙博言,等:基于多尺度和注意力机制的混合监督金属表面缺陷检测887 表 1 网络架构细节Table 1 Network architecture details 模块卷积层卷积核 特征数量L1模块输入:图片3/12Conv2D(I1)5532Max-pool22323Conv2D5564Max-pool22644Conv2D5564Max-pool2264Conv2D(I2)551 024Conv2D(I3)111Non-Local Block22I3输入1I4输出1多尺度模块I1/I3输入32/1I5/I6/I7输出1/1/1L2模块I
16、2、I4输入:1 025Max-pool221 025Conv2D558Max-pool228Conv2D5516Max-pool2216Conv2D5532(I8)Max-pool2232(I9)Avg-pool2232I5+I6+I7+I8+I967全连接层1 本文将 2 个模块的损失组合成一个统一的联合损失:Ltotal=L1+(1)L2(1)式中:作为平衡因子,平衡 2 个模块在整个模型中的作用;作为像素级标注是否存在的指示器。1.2 多尺度特征融合模块多尺度特征融合模块主要是为了解决由于不同深度的卷积层感受野大小不一导致的目标检测能力的差距问题,通过将不同尺度的特征融合在一起,可以有
17、效提高模型对于各种类型缺陷的检测能力。本文在前人的基础上,改进了多尺度特征融合模块。模块的改进思路主要有以下 2 点:1)突出多尺度的作用。本文仅通过池化操作快速改变模型的通道数便于后期的特征融合;同时避免深层卷积对多尺度的影响,突出多尺度中不同尺度对于模型的影响。2)降低多尺度的层数。过多的层数会导致参数量剧增,缺陷检测需要用较少的时间实现更好的效果。同时本文模型中相邻的不同尺度特征图之间差异并不明显,从而对模型性能提升较小。而在弱监督训练下,由于缺陷没有明显的标注,较多的尺度图的组合会提供更多的信息,但是相邻尺度间的不良影响仍然存在。11模块的构成如图 2 所示,本文仅使用第 1 层和最后
18、一层的特征,忽略中间层的特征。第 1 层具有较大的感受野,可以提高对较小目标的识别准确率。同时,对于第 1 层的特征只需要一个池化操作,随后本文提取了特征的最大值以获得更有判别力的缺陷特征。对于深层卷积输出的特征图,为了突出特征图中的明显特征,利用的卷积加强了特征的提取,此外,还进行了取平均值和取最大值操作。由于缺陷检测样本中存在大量噪声,本文利用最深层特征的平均值有效抑制噪声对模型的影响。最后利用映射连接融合不同尺度。池化层池化层全局最大池化全局最大池化全局最大池化映射连接池化层卷积11 图 2 多尺度特征融合模块Fig.2 Multi-scale feature fusion module
19、 1.3 注意力模块工业产品的缺陷检测具有环境复杂,目标小等特点,导致缺陷特征信息比较少,为了提高模型的特征表达能力,本文在模型中融入了注意力机制模块 Non-local Block,丰富特征图中的缺陷信息。相比较于其他注意力机制,Non-local Block拥有更高的计算效率并可以快速捕捉较长范围内的 2 个像素点的相互依赖。Xg g 11本文利用 Non-Local Block 单元对单通道特征图进行了进一步处理。如图 1 所示,对于输入特征图,令其分别通过、和 操作生成 3 个特征图。、和 是一个的卷积操作。令经过 和888智能系统学报第 18 卷 fgfgyi作用后的矩阵进行矩阵乘法
20、并使用 SoftMax 激活函数对结果进行处理,使其结果映射到(0,1)之间,获得注意力系数矩阵,此矩阵表示 2 个像素点之间的关联性。方法 代表某一点的线性映射,使 和 相乘,最终获得结果。整个注意力机制模块如下所示:Xout=Wyi+xi(2)W11xiyi式中:为一个卷积操作,目的是将输出的通道图转变为与输入相同,并保证整个注意力机制模块的“即插即用”;为一个残差连接,避免 Non-Local Block 模块对整个模型产生扰乱;为 Non-Local 单元。主要的结果如下所示:yi=SoftMax(xi)g(xi)=e(xTi)(xi)j(xiT)(xi)wgxi(3)与正常样品相比,
21、缺陷的特征会存在很大的不同,利用 Non-Local 注意力机制单元可以使当前像素点与其他像素点建立有效的联系,以权重数值的模式加强模型对于这些区域的关注,以提取更明显的缺陷特征。1.4 混合监督训练本文通过使用混合监督训练的方法,尝试探索不同数量的像素级标注对于精确率的影响。将图像的标注分为图像级标注和像素级标注,弱监督训练、混合监督训练和完全监督训练如图 3 所示,其中对错号(即钩叉号)分别代表图像级标注的正常图像和缺陷图像,像素级标注则为在缺陷图像上对缺陷进行按像素标记。(a)弱监督训练(b)混合监督训练(c)完全监督训练 图 3 不同训练方式对照Fig.3 Comparison of
22、different training methods 具体设定如下:1)弱监督训练:只有图像级标注,无像素级标注,(N=0);2)混合监督训练:所有图像具有图像级标注,部分缺陷图像具有像素级标注(0 N Nall);3)完全监督训练:所有图像既具有图像级标注也具有像素级标注,(N=Nall)。其中混合监督训练的像素级标注数量设为N,并且像素级标注一定是有缺陷样本。图像的标注程度由联合损失函数中的 决定,当 为 1 时,图像为正常样品和带像素级标注的缺陷样本;当 为 0 时,图像为无任何标注的缺陷样本。对于 L1模块,即便在弱监督情况下,模型的像素级识别能力也会得到训练,只有当训练数据为无任何标
23、注的缺陷样本时,L1模块才会被禁用。任何情况下,L2模型都将被训练用于从图像级角度识别图像是否有缺陷。2 仿真验证与结果 2.1 数据集和评价指标本文实验使用的数据集是当前缺陷检测领域3 个主流的数据集:KolektorSDD、KolektorSDD2和 Severstal Steel defect dataset。KolektorSDD 数据集2总共包含 399 张图片,其中 52 张为有缺陷图像,347 张为正常图片。KolektorSDD2 数据集19总共包含 3 335 张图片,其中 356 张有缺陷图像,2 979 张正常图像。该数据集在缺陷图片中融入了多种不同类型的缺陷(划痕、小斑
24、点等)。该数据集于 2021 年公布,是缺陷检测领域内最新的数据集。上述 2 个数据集都来源于 Kolektor Group d.o.o 在真实生产环境中捕获的金属表面的图片。Severstal Steel defect 数据集远大于其他 2 个数据集,包含 4 类 12 568 张灰度图像,其中包含各种缺陷。图像来源于 Severstal 公司在平板钢生产时的图形。在实验中,本文仅使用数据集的一个子集进行训练。评估模型性能时,由于工业环境下对缺陷检测要求只有有无缺陷 2 种情况,所以本文采用工业环境内常用的精确度(average precision,AP)作为评价指标,其计算方式为A=w10
25、p(r)dr(4)p=TT+F(5)第 4 期孙博言,等:基于多尺度和注意力机制的混合监督金属表面缺陷检测889 p式中:A 为精确度,为模型的准确率,T 为正确划分为正例的样本数,F 为错误划分为正例的样本数。2.2 实验设计对于像素级标注图像的数量 N,本文在进行了不同数量的实验后,分别选定了最具有代表性的数目。KSDD 数据集设计了 N=0,5,15,20,all;KSDD2 数据集设定 N=0,16,53,126,246。上述2 个数据集训练时,Epoch 为 50,学习率为 0.01,BatchSize 为 1。STEEL 数据集:选择了数据集中部分缺陷图像 Nall作为样本,Nal
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 尺度 注意力 机制 混合 监督 金属表面 缺陷 检测
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。