融合自适应注意力的多尺度火灾检测算法.pdf
《融合自适应注意力的多尺度火灾检测算法.pdf》由会员分享,可在线阅读,更多相关《融合自适应注意力的多尺度火灾检测算法.pdf(11页珍藏版)》请在咨信网上搜索。
1、融合自适应注意力的多尺度火灾检测算法梁煜,陈童,张为(天津大学 微电子学院,天津300072)摘 要:针对实际场景下火灾检测准确度不高的现象,根据火灾自身特征提出了一种基于 Anchor-free 结构的火灾检测算法.将特征提取网络残差模块设计为多分支结构,并在其基础上嵌入根据火焰特征设计的自适应注意力模块,提取出更具表达力的火焰特征.添加亚像素融合,利用高层特征丰富的通道信息增强多尺度特征的表达能力.设计特征增强模块强化最高层特征表示,更好地利用全局空间信息.引入自适应标签分配,强化网络对火焰特征的学习效果.利用改进后的 GIoU Loss 损失函数对边界框精细回归.该算法在自建数据集上的检
2、测精度达到了94.9%,在公开数据集上也有较好的检测效果,且抗干扰能力强,适用于各种环境下的火灾检测,能够满足实际场景下火灾检测任务的需要.关键词:深度学习;火灾检测;自适应注意力;多尺度特征增强中图分类号:TP391.41 文献标志码:A 文章编号:1001-0645(2024)01-0091-11DOI:10.15918/j.tbit1001-0645.2023.022Multi-Scale Fire Detection Algorithm with Adaptive AttentionLIANG Yu,CHEN Tong,ZHANG Wei(School of Microelectron
3、ics,Tianjin University,Tianjin 300072,China)Abstract:In order to improve the accuracy of fire detection in actual scenes,a fire detection algorithm was pro-posed based on Anchor-free structure according to the characteristics of fire.Firstly,the ResNet block of featureextraction network was designed
4、 as a multi-branch structure,and the attention block designed according to theflame features was embedded on the basis to extract the more expressive features.And then,a subpixel fusionwas added to enhance the expression ability of multi-scale features by utilizing the abundant feature informationin
5、 high-level channel.Finally,a feature enhancement module was designed to enhance the top-level feature rep-resentation and make better use of global spatial information.Adaptive label assignment was introduced to en-hance the learning ability of the extraction network to flame features.Retreating ca
6、refully to the boundary condi-tion with improved GIoU Loss function,the detection accuracy of this algorithm can reach up 94.9%on the self-built data set,also show a good detection effect on the public data set.The experimental results show that the al-gorithm model can provide a high detection accu
7、racy and strong anti-interference ability.In addition,this al-gorithm can also provide a better detection effect on multi-scale flame under complex background,suitable forfire detection in various environments,can meet the needs of actual fire detection tasks.Key words:deep learning;fire detection;a
8、daptive attention;multi-scale feature enhancement 火灾是日常生活中最常见的灾害之一,一旦发生,会给人们的生命财产带来巨大的威胁.因此,在火灾发生的初期进行快速有效的检测并进行预警具有重大的意义.早期基于传感器的火灾检测方法受环境、空间的影响较大,且响应时间长,局限性较大.随着计算机视觉的发展,火焰检测技术逐渐由基于传感器的识别演变为图像检测技术,其检测速度快,准确率高,且能够感知火灾发生的具体位置,逐渐成 收稿日期:2023 02 09基金项目:国家重点研发计划课题(2020YFC1522405);天津市新一代人工智能科技重大专项(19ZXZN
9、GX00030)作者简介:梁煜(1975),男,副教授,硕士生导师,E-mail:.通信作者:张为(1975),男,教授,博士生导师,E-mail:.第 44 卷第 1 期北 京 理 工 大 学 学 报Vol.44No.12024 年 1 月Transactions of Beijing Institute of TechnologyJan.2024为火灾检测的主流.传统的图像检测技术主要是利用机器学习算法,选择火焰的颜色、运动以及闪烁频率等特征进行提取并分类识别,进而输出火焰检测结果.FOGGIA等1基于火焰的形状、颜色和运动特性,设计了一个实时的火灾检测系统模型.MUHAMMAD 等2使用
10、了多种经典分类网络分别来提取火焰特征,避免了繁琐耗时的预处理过程,根据实际问题提出了轻便高效的火灾检测模型.YU 等3提出了一种用于火灾烟雾实时检测的纹理分析方法,利用了火焰的纹理特征进行识别.KHAN 等4提出一种结合火焰的颜色、边界、面积、圆形度等特征的分类模型,同时利用了火焰的静态与动态特征.但是上述方式均是基于人工提取特征,消耗时间长,且算法鲁棒性低.近年来,基于深度学习技术的图像型火灾检测技术由于其准确率高、速度快且受外界干扰小逐渐发展起来.KIM 等5运用了 Faster R-CNN 检测疑似火灾区域和非火灾区域,构建了一种基于深度学习和视频序列的火灾检测方法.将卷积神经网络广泛应
11、用于火焰特征提取,能够使用户获得更加丰富的火焰特征信息,增强了对火焰的识别能力.皮骏等6将 YOLOv5s 的主干网络替换成 Shufflenet v2,并加入 CA 注意力模块,让骨干网络对图片信息的提取效率变得更快,在保持网络精度的同时保证检测速度,能满足在白天、黑夜或视野良好等情况下对森林火灾的实时性预防与检测.叶铭亮等7结合 Transfor-mer 与深度学习算法并应用于森林火灾检测领域,在 Swin Transformer 网络结构中对窗口自注意力机制进行改进,采用了 KNN 自注意力提高对小块噪声的识别,使用 Augmentation 数据增强方法增加模型的泛化能力.上述的检测算
12、法在火灾检测任务中取得了不错的效果,但是也存在一些局限性,首先是实际场景下检测效果不太理想,针对一些特定背景、特定形状的火焰检测效果好,但是不能很好地应用于复杂场景,环境背景适应性较差.其次,由于摄像头远近以及火势蔓延程度不同,火焰在图片中呈现的尺度变化较大,算法对多尺度火焰检测精度较低.鉴于目前火焰检测算法中存在的问题,本文采用了 Anchor Free 结构设计了一种适用于实际场景的多尺度火灾检测算法.该算法将主干网络残差模块设置为多分支结构并替换原本的 33 卷积为自适应注意力模块提取出更具表达力的火焰特征,之后在特征融合网络通过亚像素卷积减少信息丢失,并对高层特征进一步增强融合,最后根
13、据火焰形状自适应地产生正样本用于之后的预测,改进 GIoU Loss 以获得更准确的边界框回归.该算法能够实时检测多尺度火焰目标,而且具有准确率高、误报率低等优点,适用于各种实际场景下的火灾检测任务.1 算法设计 1.1 网络整体结构本文构建了如图 1 所示的火灾检测算法,整体采用了无锚框网络的基本形式.为了提取到更为丰富的火焰特征,选取经典的特征提取网络 ResNet-508作为基础的主干网络,将残差模块设置为多分支结构,并添加自适应注意力模块用于关注通道信息以及选取适合的感受野.颈部网络用于将高分辨率特征和强语义特征结合,本文首先引入了特征金字塔 FPN9结构用于融合不同层的特征.在此基础
14、上,通过亚像素卷积减轻通道缩减造成的信息缺失问题,并引入特征增强模块丰富特征解决了 FPN 自上而下融合过程中导致的高层特征缺失问题.此外,检测网络分为两个分支分别用于分类和回归,两个分支都先经过 4 个卷积层进行特征强化.之后,分类分支再通过一个 33 卷积得到的特征图,C5C4C3C2P5P4HW256HW256回归HW4中心度HW1分类HW1HW256HW25644P3P2预测预测预测主干网络颈部网络检测网络预测图 1 火灾检测算法网络结构Fig.1 Network structure of fire detection algorithm92北 京 理 工 大 学 学 报第 44 卷=
15、2 =0.25HW 4该特征图上每一个点对应的值代表预测为火焰的概率,中心度分支预测当前位置与要预测的目标中心点的归一化距离.在分类网络训练过程中,由于背景点数量较多会导致正负样本不均衡,因此选用 FocalLoss10作为分类损失函数,具体运算如公式(1)所示,取,.回归分支生成的特征图预测锚点到检测框上下左右四条边界的距离.并用改进后的 GIoU Loss11作为回归损失函数.FL(p)=(1 p)log(p)y=1(1)plog(1 p)其他(1)1.2 融合自适应注意力的主干网络火焰本身具有丰富的自身特征.例如,火焰颜色在实际场景中往往与周围环境有较大的差异性.诸如温度和燃烧物的材料都
16、会影响火焰的颜色,颜色随着温度的升高而倾向于冷色,随着温度的降低而倾向于暖色.燃烧温度的高低也会影响火焰饱和度和亮度的变化.此外,火焰形状大小多变,受不同燃烧材料和燃烧环境的影响,火焰随时间的蔓延程度也有很大不同.然而由于现有的主干网络感受野大小有限并且缺乏跨通道之间的相互作用,往往不能很好地关注到火焰本身的特征,因此,本文对 ResNet-50 主干网络进行了改进,以期网络能在众多背景点中更关注火焰的特征,提高检测的准确度.本文将 ResNet 主干网络中的每一个残差模块设计成多分支结构,即用一种平行堆叠相同结构的block,可以在不增加参数量级的基础上提升模型的准确率,同时还能减少超参数的
17、数量,并添加注意力模块.改进前后的残差模块如图 2 所示,整体采用组卷积的形式,group 数为 32,并将原本的 33 卷积替换成本文设计的自适应注意力模块.为了更好地适应火灾尺度变化较大的特征,提HW CHW C升对于火灾的检测效果,受 SKNet12的启发,本文设计了如图 3 所示的自适应注意力模块,双分支结构可以对不同的输入分配不同大小的感受野.与 SK-Net 不同的是,本文并没有采用全连接的方式对通道嵌入空间信息,而是借鉴 ECANet13的思想,采用局部跨通道交互的方式对通道分配权重,避免了降维对于学习通道注意的影响,自适应地分配通道权重.2.2.1 节对比试验可以显示本文提出的
18、自适应注意力模块对于火焰检测的效果优于 SKNet 和 ECANet.该模块整体结构分为 33 和 55 两个分支,对于的输入特征分别经过这两个分支之后进行特征相加融合,此时得到的的中间特征融合了不同感受野的上下文信息.该融合后的特征再经 输入113311+(a)ResNet-50的残差模块11111111自适应注意力模块1111自适应注意力模块自适应注意力模块输入32路+(b)本文设计的残差模块图 2 改进前后的残差模块Fig.2 Res Block structure before and after improvement HWCHWCHWCHWCHWC11C11Ck=5SoftmaxS
19、oftmaxHWCHWC33卷积55卷积全局平均池化矢量相乘矢量相加图 3 自适应注意力模块的具体实现Fig.3 Concrete implementation of adaptive attention block第 1 期梁煜等:融合自适应注意力的多尺度火灾检测算法9311C过一个全局平均池化层(global average pooling,GAP)整合全局空间信息,并且与相邻的 5 个通道进行跨通道交互,局部跨通道之间的交互可以使得网络更关注有效的通道,此时得到的的特征包含了丰富的通道信息.再通过归一化函数 Softmax 分配通道权重,该权重代表了每个通道对特征提取的影响力.通过保留更
20、有价值的特征,从而达到提高特征表示能力的目的.最后再与原图像相乘得到携带通道权重的输出,两部分相加即为最终自适应注意力模块的输出.局部跨通道之间的交互是通过一个权重共享的卷积核大小为 k 的一维卷积实现的,在全局平均池化层之后的特征上进行跨通道之间的交互,分配权重信息,对应表达式如下:=S(C1Dk(y)(2)i=Skj=1jyji,yji ik(3)C1Dkiyiiyikiyi式(2)为整体权重计算表达式,其中代表通道权重,S 代表 SoftMax 激活函数,代表卷积核大小为 k 的一维卷积,k 代表局部跨通道的覆盖率.式(3)为单层特征权重计算的表达式,为第 i 层特征对应的权重,j 表示
21、通道,是通过相邻的 k 个通道计算得到的,代表了相邻 k 个通道的集合.经实验验证当 k=5 时效果最好,因此本文设置超参数 k为 5,具体实验见 2.2.1 节.自适应注意力模块的 33 和 55 两个分支可以提供不同的感受野大小.而火焰在实际场景中由于距离摄像头远近的不同以及蔓延程度的不同,在图像中展示出的尺度不同.因此,网络可以根据火焰不同尺度进行自适应的调整,对于不同输入使用的卷积核感受野不同,参数权重也不同,可以自适应地对输出进行处理,分配不同的感受野大小.考虑每个通道及其相邻的 5 个通道来捕获跨通道交互,即每一层都关注和它相邻的 5 层通道的相互作用,通过分配权重表示了每个通道对
22、特征提取的影响力.提升对当前火灾检测有用的特征图通道的权重,抑制对当前任务作用不大的特征通道,从而让神经网络重点关注权重值大的通道,通过显式的构建卷积特征通道之间的相互依赖关系来提高网络的表示能力.所以经过自适应注意力模块,网络不仅可以根据火焰本身尺度大小自适应地选取感受野,还能够自适应地给定通道权重,更适于提取火焰特征.为了证明本文设计注意力模块的有效性,与经典的注意力机制进行了对比试验,具体实验结果见 2.2.1 节.本文改进后的整体主干网络结构和 ResNet-50对比如表 1 所示,改进后的主干网络更关注通道特征之间的关系,增加了有用通道的权重,抑制了不相关的特征信息.此外,网络可以对
23、不同尺度的火焰自适应的选择感受野大小,使得网络的输出特征更加丰富,提高了火焰特征提取网络的鲁棒性,有利于提高火焰检测任务的检测效果.表 1 改进前后主干网络结构对比Tab.1 Comparison of backbone structure before and after improvement网络层次输出尺寸ResNet-50结构Conv111211277,64,s=277,64,s=233,最大池化层,s=233,最大池化层,s=2Conv2_x565611,6433,6411,256311,128自适应注意力,128,g=3211,2563Conv3_x282811,12833,128
24、11,512411,256自适应注意力,256,g=3211,5123Conv4_x141411,25633,25611,1024611,512自适应注意力,512,g=3211,10249Conv5_x7711,51233,51211,2048311,1024自适应注意力,1024,g=3211,20483 1.3 多尺度特征增强在实际火灾场景中,火焰离摄像头远近不同或者火灾蔓延的程度都会导致火焰尺度有明显的变化,这对算法模型的多尺度检测能力提出了更高的要求.94北 京 理 工 大 学 学 报第 44 卷高层网络感受野较大,语义信息表征能力强,但空间信息表征能力较弱;而低层网络感受野空间信息
25、表征能力强,语义信息表征能力弱.传统的 FPN 结构通过自上而下的信息融合一定程度上改善了对于多尺度目标的检测效果,但是也存在以下两点不足:111)FPN 网络初期为了提高计算效率采用卷积进行通道维度缩减时会导致严重的信息丢失,侧重于在缩减后的 256 个通道的特征金字塔 Pi上开发有效的模块,但是没有充分利用 Ci丰富的通道信息.2)较低层次的特征映射通过自上而下的融合可以合并较高层次的语义信息,但是最高层次的特征只包含单一级别的上下文信息.P5因此,为了更好地满足多尺度火焰检测的需求,本文在原有 FPN 的基础上添加了亚像素融合方法(sub-pixel conv),并且利用特征增强模块(f
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 融合 自适应 注意力 尺度 火灾 检测 算法
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。