衔接注意力机制与残差ASP...W-Net工业烟尘图像分割_詹光莉.pdf
《衔接注意力机制与残差ASP...W-Net工业烟尘图像分割_詹光莉.pdf》由会员分享,可在线阅读,更多相关《衔接注意力机制与残差ASP...W-Net工业烟尘图像分割_詹光莉.pdf(12页珍藏版)》请在咨信网上搜索。
1、第 40 卷第 1 期2023 年 1 月控 制 理 论 与 应 用Control Theory&ApplicationsVol.40 No.1Jan.2023衔衔衔接接接注注注意意意力力力机机机制制制与与与残残残差差差ASPP的的的W-Net工工工业业业烟烟烟尘尘尘图图图像像像分分分割割割詹光莉1,2,刘辉1,2,陈甫刚3,杨路1,2(1.昆明理工大学 信息工程与自动化学院,云南 昆明 650500;2.昆明理工大学 云南省人工智能重点实验室,云南 昆明 650500;3.云南昆钢电子信息科技有限公司,云南 昆明 650302)摘要:工业烟尘图像分割是基于烟尘图像监测污染等级判定的重要环节.
2、针对工业烟尘分割时存在的小目标烟尘漏检、大目标烟尘误检以及分割结果精度低等问题,提出了一种结合衔接注意力机制和残差空洞空间金字塔池化(ASPP)的W-Net网络.使用衔接注意力机制将两个U-Net网络组合成W-Net,W-Net 能充分利用烟尘的轮廓、位置信息进行烟尘粗分割和细分割操作,两次分割能达到更精细的分割效果;此外,针对W-Net中的普通卷积功能过于简单而不能更好地提取烟尘特征的问题,提出一种兼具残差块和ASPP功能的残差ASPP结构,同时还能根据大小目标烟尘的特点进行针对性分割,分割结果更全面完整.实验结果表明,结合衔接注意力机制与残差ASPP的W-Net以较小的分割效率损失为代价获
3、得了较高的分割精度,Recall,IoU与F-score指标提高了4%5%,解决了大小目标烟尘存在的分割问题,烟尘的分割效果也优于其他语义分割网络.关键词:工业烟尘;图像分割;注意力机制;空洞空间金字塔池化;W-Net引用格式:詹光莉,刘辉,陈甫刚,等.衔接注意力机制与残差ASPP的W-Net工业烟尘图像分割.控制理论与应用,2023,40(1):160 171DOI:10.7641/CTA.2022.10993Connection attention mechanism and residual ASPP of W-Netindustrial smoke image segmentation
4、ZHAN Guang-li1,2,LIU Hui1,2,CHEN Fu-gang3,YANG Lu1,2(1.Faculty of Information Engineering&Automation,Kunming University of Science and Technology,Kunming Yunnan 650500,China;2.Yunnan Key Laboratory of Artificial Intelligence,Kunming University of Science and Technology,Kunming Yunnan 650500,China;3.
5、Yunnan Kungang Electronic and Information Science Ltd,Kunming Yunnan 650302,China)Abstract:Industrial smoke image segmentation is an important part of pollution level judgment based on the smokeimage monitoring.Aiming at the problems of small target smoke missing detection,large target smoke false d
6、etection andlow precision of segmentation results in industrial smoke segmentation,a W-Net network combining connection attentionmechanism and residual atrous spatial pyramid pooling(ASPP)is proposed.Two U-Net networks are combined into aW-Net by using a connection attention mechanism.The W-Net can
7、make full use of the contour and position informationof smoke for coarse and fine segmentation,and two segmentations can achieve finer segmentation effect.In addition,aim-ing at the problem that the common convolution function in W-Net is too simple to extract the characteristics of smoke,an improve
8、d ASPP structure with both residual block and ASPP function is proposed,which can also perform targetedsegmentation according to the characteristics of large and small target smoke,and the segmentation result is more com-prehensive and complete.Experimental results show that the W-Net obtains higher
9、 segmentation accuracy at the cost ofless segmentation efficiency loss in combination with connection attention mechanism and residual ASPP.The indexes ofthe Recall,IOU and F-score are improved by 4%5%,which solves the segmentation problem of large and small targetsmoke,and the segmentation effect o
10、f smoke is also better than other semantic segmentation networks.Key words:industrial smoke;image segmentation;attention mechanism;atrous spatial pyramid pooling;W-NetCitation:ZHAN Guangli,LIU Hui,CHEN Fugang,et al.Connection attention mechanism and residual ASPP of W-Netindustrial smoke image segme
11、ntation.Control Theory&Applications,2023,40(1):160 171收稿日期:20211018;录用日期:20220222.通信作者.E-mail:;Tel.:+86 15368185621.本文责任编委:张化光.国家自然科学基金项目(61863018),云南省科技厅应用基础研究项目(202001AT070038)资助.Supported by the National Natural Science Foundation of China(61863018)and the Applied Basic Research Programs of Yunna
12、n Science andTechnology Department of China(202001AT070038).第 1 期詹光莉等:衔接注意力机制与残差ASPP的W-Net工业烟尘图像分割1611引引引言言言随着现代工业化建设的高速发展,工业烟尘的大量排放造成了大气污染等环境问题.工业烟尘中包含大量的CO2,SO2气体,危害环境的同时也危害人类的身心健康,因此有效控制工业烟尘排放迫在眉睫.烟尘浓度是工业烟尘污染监测中的一项重要指标,实时监测烟尘浓度具有非常重要的意义.使用高精度测量仪器在排烟口分析烟尘成分,精度高但仪器维护成本也高;采用人工目测法把烟尘与排放标准进行对照,操作简单、成本
13、较低但准确率受人为因素影响较大;利用计算机图像识别技术来监测工业烟尘浓度污染等级,速度快、成本低、实时性高、准确率高,能有效控制烟尘排放,从而达到节能减排、保护生态环境的作用1.目前使用最广的工业烟尘浓度污染等级监测方法是基于林格曼烟气黑度图的方法,该方法包含4个环节:采集烟尘图像、分割烟尘与背景、提取烟尘区域和判定烟尘污染等级,其中分割烟尘与背景是该方法中最关键也最难实现的环节2.面向烟尘图像的分割方法根据实现方式可以分为基于人工特征的传统图像分割方法与基于深度学习的分割方法.基于人工特征的图像分割方法因计算机的计算性能有限,只能利用图像的颜色信息、纹理信息和空间结构等有限特征来进行图像分割
14、,时间损耗大且分割精确度低,比如阈值分割法34、纹理分析法56、帧间差分法78和基于区域分割910的方法.随着现代计算机领域技术的不断发展,计算机的性能越来越高,深度学习的方法也随之出现,并在图像识别、目标检测、图像分割等计算机视觉领域中广泛使用.当前,已有许多学者将深度学习的方法用于工业烟尘图像分割任务,并取得了比传统图像分割方法更好的效果.首先,文献1112将传统的深度学习神经网络应用于烟尘图像分割中,实现了像素级分割,但此类方法对于图像的局部特征提取不全面,在有干扰的情况下分割效果不佳;于是,Tingting Li等13将传统方法集成到卷积神经网络中,提出一种改进的空洞卷积DenseNe
15、t网络(wildfire smoke dilated DenseNet,WSDD-Net)用于烟雾检测,该网络通过结合扩张卷积和密集块实现烟雾多尺度特征提取,但是该算法计算的复杂度较高,且烟雾边缘分割结果不够完整;因此,Feiniu Yuan等14考虑到烟雾这类非刚性物体具有形态各异、边缘难确定的特点,提出改进的双路卷积神经网络算法,获得了较完整的烟雾边缘分割结果;但以上方法在背景较为复杂的情况下,分割效果有待提高,于是,刘辉等2在考虑多种场景下烟雾的不同特点,使用结合多尺度与动态损失函数的全卷积网络(fully convolutional networks,FCN)对5个场景下的烟尘图像进行
16、分割,整体分割效果较好,但该网络的部分分割结果依然存在小目标烟尘漏检、大目标烟尘误检的现象.以上深度学习方法并没有针对性的解决小目标烟尘的分割问题,因此,工业烟尘分割任务中仍需要解决小目标烟尘分割问题.本文以小目标烟尘场景下的图像为数据集进行烟尘分割,针对小目标烟尘尺寸小、边缘稀薄和大目标烟尘尺寸大、轮廓边缘复杂多变的特点,对U-Net的网络结构进行改进.使用衔接注意力机制将两个U-Net网络组合成W-Net,W-Net能充分利用烟尘的轮廓、位置信息进行烟尘粗分割和细分割操作,从而达到解决小目标烟尘漏检、大目标烟尘误检等问题的目的.另外,将网络中的普通卷积改进为残差空洞空间金字塔池化(atro
17、us spatial pyramid pooling,ASPP),使得网络对大小目标烟尘的特征提取过程更具有针对性,分割的烟尘更完整、精确.实验结果表明,本文提出的网络具有良好的烟尘分割性能.2基基基于于于U-Net网网网络络络的的的工工工业业业烟烟烟尘尘尘分分分割割割问问问题题题分分分析析析工业烟尘图像分割的任务是把图像中的所有烟尘从背景中分割出来,根据烟尘和背景的特点可将烟尘图像分为不同场景下的数据集.其中,面积小于整幅图像1%的烟尘被鉴定为小目标烟尘,将包含小目标烟尘的图像作为一个数据集,该数据集中的图像至少含有一个小目标烟尘,甚至含有多个烟尘,存在大小目标烟尘共存的情况.本文对小目标烟
18、尘场景数据集进行分割,考虑到该数据集图片较少的情况,使用U-Net网络进行训练预测.与其他语义分割网络1520相比,U-Net网络21的优势在于能针对规模较小的数据集进行端到端的快速训练,但U-Net网络在小目标烟尘场景下的分割结果并不理想,如图1所示,1(a)为工业烟尘原图,1(b)为人工标记的标签,1(c)为U-Net网络的分割结果,分割结果的两幅图中存在小目标烟尘漏检、大目标烟尘误检等问题,并且分割精确度较低.分析原因,主要有以下两点:1)U-Net网络由收缩路径和扩展路径组成,两个路径之间使用复制、剪切操作进行对称连接,这种网络结构对于易识别的数据集来说简单又有效2223,但对于目标和
19、背景都复杂多变的小目标烟尘数据集来说,信息的提取、恢复、融合不够准确高效,能利用到的有效信息有限,使得U-Net在识别、分割大小目标烟尘时比较粗糙,分割出来的烟尘结果不完整.2)U-Net网络用于提取特征的卷积操作功能单一、不全面,卷积层的卷积核大小只有一个33的尺寸,提取到的图像特征比较片面,具有局限性.而本文中的小目标烟尘数据集中的图像包含多个大小不一、形状多变的烟尘,在经过多次卷积之后,小目标烟尘容易被整个遗漏,大目标烟尘容易遗失边缘信息.类型单一的卷积层不适用于多尺寸、多目标下的烟尘162控 制 理 论 与 应 用第 40 卷分割,提取到一部分有限信息的同时也遗失了一部分有效特征信息.
20、图 1 小目标烟尘漏检和大目标烟尘误检情况Fig.1 Small target smoke missing detection and largetarget smoke false detection3面面面向向向烟烟烟尘尘尘分分分割割割的的的衔衔衔接接接注注注意意意力力力机机机制制制与与与残残残差差差ASPP的的的W-Net3.1结结结合合合衔衔衔接接接注注注意意意力力力机机机制制制的的的W-Net针对U-Net由于信息提取、恢复与融合的操作过于简单而导致对大小目标烟尘分割没有针对性的问题,本文对U-Net的网络结构进行改进.首先对注意力机制进行改进,并取名为衔接注意力机制(connect
21、ionattention mechanism,CAM),然后使用衔接注意力机制将两个U-Net网络进行连接,第1个U-Net网络起到粗分割烟尘的作用,第2个U-Net网络起到细分割烟尘的作用,本文提出的整体网络结构如图2所示,网络层的输出尺寸如表1所示.图2中的粗分割结果是第1个U-Net网络的烟尘分割结果,细分割结果是本文方法“结合衔接注意力机制和残差ASPP的W-Net网络”的烟尘分割结果.图 2 结合衔接注意力机制与残差ASPP的W-Net网络结构示意图Fig.2 Schematic diagram of W-Net network combining connection attent
22、ion mechanism and residual ASPP计算机视觉领域的注意力机制的核心逻辑18是“从关注全部到关注重点”.未改进的注意力机制结构如图3所示,x和g为输入,x为输出.x是需要被关注的对象,大小为H W C1,g是提供注意力信息的对象,大小为H W C2.x和g分别经过11的卷积变换之后进行逐元素相加,相加后的向量依次经第 1 期詹光莉等:衔接注意力机制与残差ASPP的W-Net工业烟尘图像分割163过ReLU激活函数、11卷积和Sigmoid激活函数之后得到一个注意力系数,将与向量x进行融合得到最终的输出 x,大小为H W C2.注意力系数能够根据g输入的信息来识别、保留
23、、增强x中的目标区域特征,注意力系数的公式如下:=2(1(Wxx+Wgg+bg)+b),(1)其中:0,1,x与g为输入变量;Wx,Wg与均为11的卷积运算,起到线性变换的作用;bg与b为偏差项;1与2分别为ReLU激活函数和Sigmoid激活函数,起到归一化的作用.表 1 本文网络层输出尺寸设置Table 1 Network layer output size settings of thispaper第1个U-Net网络层输出尺寸第2个U-Net网络层输出尺寸输入图像(224,224,3)输入图像(224,224,7)残差ASPP 1(224,224,64)残差ASPP 1(224,224
24、,64)Maxpooling 1(112,112,64)Maxpooling 1(112,112,64)残差ASPP 2(112,112,128)残差ASPP 2(112,112,128)Maxpooling 2(56,56,128)Maxpooling 2(56,56,128)残差ASPP 3(56,56,256)残差ASPP 3(56,56,256)Maxpooling 3(28,28,256)Maxpooling 3(28,28,256)残差ASPP 4(28,28,512)残差ASPP 4(28,28,512)Maxpooling 4(14,14,512)Maxpooling 4(14
25、,14,512)残差ASPP 5(14,14,1024)残差ASPP 5(14,14,1024)转置卷积 1(28,28,1024)转置卷积 1(28,28,1024)残差ASPP 6(28,28,512)残差ASPP 6(28,28,512)转置卷积 2(56,56,512)转置卷积 2(56,56,512)残差ASPP 7(56,56,256)残差ASPP 7(56,56,256)转置卷积 3(112,112,256)转置卷积 3(112,112,256)残差ASPP 8(112,112,128)残差ASPP 8(112,112,128)转置卷积 4(224,224,128)转置卷积 4(
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 衔接 注意力 机制 ASP Net 工业 烟尘 图像 分割 詹光莉
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。