基于注意力机制和深度残差网络的滚动轴承故障诊断.pdf
《基于注意力机制和深度残差网络的滚动轴承故障诊断.pdf》由会员分享,可在线阅读,更多相关《基于注意力机制和深度残差网络的滚动轴承故障诊断.pdf(9页珍藏版)》请在咨信网上搜索。
1、第 48 卷 第 1 期燕山大学学报Vol.48 No.12024 年 1 月Journal of Yanshan UniversityJan.2024 文章编号:1007-791X(2024)01-0039-09基于注意力机制和深度残差网络的滚动轴承故障诊断时培明1,吴术平1,于 越1,张 宇2,许学方1(1.燕山大学 电气工程学院,河北 秦皇岛 066004;2.燕山大学 车辆与能源学院,河北 秦皇岛 066004)收稿日期:2022-12-20 责任编辑:温茂森 基金项目:河北省自然科学基金-青年基金资助项目(E2022203093);秦皇岛市科学技术研究与发展计划项目(202101A3
2、45)作者简介:时培明(1979-),男,黑龙江延寿人,博士,教授,博士生导师,主要研究方向为设备状态监测与故障诊断,Email:spm 。摘 要:针对现有的滚动轴承诊断模型特征提取能力不足、诊断准确率不高的问题,提出一种注意力机制与一维深度残差网络相结合的故障诊断方法。该方法首先通过引入残差结构来防止深度网络性能退化,然后结合注意力机制来提高网络的特征提取能力,最后使用原始的滚动轴承振动信号训练故障特征分类器。针对变工况故障诊断,本文采用小样本迁移学习框架。在两个开源实验平台上的结果表明,该方法能够有效地提高滚动轴承故障诊断的准确率,为实际应用提供一定的理论参考。关键词:滚动轴承;注意力机制
3、;残差网络;特征提取;迁移学习中图分类号:TH113.1 文献标识码:A DOI:10.3969/j.issn.1007-791X.2024.01.0050 引言 滚动轴承是旋转机械设备中必不可少的零部件之一1,起着支撑旋转体、降低传动设备摩擦系数等作用。滚动轴承已广泛用在各类工业产品中,如电动机、内燃机等,滚动轴承的健康状态在很大程度上决定着这些机械设备能否正常运行。一旦滚动轴承出现故障,轻则可能造成设备停机、企业停产,重则可能造成严重的生产事故、人员伤亡等2,给企业生产、国民经济带来不小的损失。深度学习的发展和应用给滚动轴承的故障诊断带来了新的研究方法,这极大地克服了传统的基于信号处理方法
4、的特征提取不足、诊断精度不高、需要大量的专家经验等缺点。近年来,各种神经网络在滚动轴承故障诊断的研究和应用层出不穷,研究成果呈现出井喷的增长趋势。赵小强等3改进了传统的 LeNet-5 网络,并采用 L2 正则化等方法优化了网络,使得新网络具备更强的特征提取能力。毕鹏远4提出了一种卷积与长短期记忆网络相结合的模型,得到了较好的故障诊断精度。谭帅等5提出周期记忆神经网络,利用时序信号内在的时序关联关系进行故障诊断,实现了轴承的故障诊断。黄磊等6基于经验模态分解、格拉姆算法和 GoogLeNet 网络,使得诊断的准确率达到了一定高度。刘杰等7基于最小二乘生成对抗网络和 SqueezeNet 网络,
5、提高了样本不足条件下的故障诊断准确率。姜万录等8提出一种基于平滑伪 WignerVille 分布和深度学习相结合的诊断方法,可以较好地识别故障轴承。上述的各种网络模型都用到了卷积神经网络(Convolutional Neural Network,CNN),但其结构都较为固定,主要体现在 CNN 的感受野(Convolution Receptive Field,CRF)是单一的,这使得神经网络的适应性受到极大的挑战,表现为模型特征提取能力不强、训练成本高等。除此之外,一些学者将一维的振动信号转换成类似图片的高维信号来研究,这不仅增加了数据和模型的复杂度,还可能使得振动信号特征丢失9,从而给诊断过
6、程带来不必要的麻烦。40 燕山大学学报2024 选择 性 核 网 络(Selective Kernel Networks,SKNet)拥有两路不同的 CRF,能有效提高神经元的适应能力,表现为该网络允许每个神经元根据输入信息的多个尺度自适应地调整 CRF 大小,还会通过权重的调整使模型专注于较为重要的特征通道,从而可以更好地识别故障特征,故 SKNet 又称为注意力机制。残差结构通过特有的短接层使得深度网络性能不会退化,为更深层的网络搭建提供了基础。综合上述考虑,本文提出一种注意力机制结合残差结构的网络模型 MSD-ResNet1D(Modified SKNet with Deep ResNe
7、t1D)。在两个数据集上的实践表明 MSD-ResNet1D 在滚动轴承故障诊断中有着优良的表现,具有应用价值。1 ResNet1D 网络1.1 残差结构 深度残差网络拥有独特的残差单元10,其特点在于短接线的引入,如图 1 所示。图 1 残差单元Fig.1 Residual unit 模型在训练时,数据经过新增的权重层,如果不能使得梯度下降,那么就仅仅复制浅层特征,即对浅层网络进行恒等映射,这样保证了深度网络的性能不会退化。残差单元的输出公式:y=F(x)+x,(1)式中,x 代表输入,y 代表输出,F(x)代表经过权重层的结果。1.2 组卷积 组卷积的概念最早出现在 2012 年提出的Al
8、exNet 网络11。使用组卷积后,参数量减少为原来的1g(g1)。不仅如此,组卷积还增加相邻层过滤器之间的对角相关性,有效防止过拟合的产生。1.3 ResNet1D 结构 本文使用一维 CNN 搭建深度残差网络,因为原始的滚动轴承振动数据本身为一维数据,使用一维 CNN 可以直接对数据进行特征提取,故称该网络为 ResNet1D。ResNet1D 网络有10 层,由1 个卷积层、4 个残差单元以及 1 个全连接层组成,且将 ResNet1D 的所有卷积设置为组卷积。网络的详细信息如表 1 所示。表 1 ResNet1D 网络结构Tab.1 ResNet1D network structure
9、基本单元名称组成元素输入数据通道或大小输出数据通道或大小卷积核大小组卷积卷积层 0Conv014131残差层 1Conv1_blk146132Conv1_blk266132残差层 2Conv2_blk168132Conv2_blk288132残差层 3Conv3_blk1810132Conv3_blk21010132残差层 4Conv4_blk11012132Conv4_blk21212132全连接层FC1238102 SKNet 网络2.1 SKNet 简介及改进 SKNet 是由 Li 等人提出的一种轻量化网络结构12,用于图像分类并取得显著的成绩。笔者根据滚动轴承故障诊断的实际背景和数据
10、维度对其进行改进,改进后的网络(Modified SKNet,M-SKNet)结构如图 2 所示。SKNet 的设计体现了多 CRF 特征融合的思想,使得模型能够捕获多尺度的信息,再者是对不同尺寸卷积核的输出结果进行权重分配,希望更能突出有用的数据信息,故称其为注意力机制。第 1 期时培明 等 基于注意力机制和深度残差网络的滚动轴承故障诊断41 图 2 M-SKNet 结构Fig.2 M-SKNet structure2.2 空洞卷积 空洞卷积是指在普通卷积核中引入空洞 0,以此扩大 CNN 的 CRF,捕获更大尺度的数据信息。图 2 中,Conv_A 代表普通的卷积,其卷积核为 13C,C
11、代表通道数,而 Conv_B 代表空洞卷积,其卷积核与 Conv_A 的一样,但是其膨胀系数为2,最终其卷积核为大小为 15C。空洞卷积不仅扩大了感受野,并且由于填充了 0,所以其计算量也变小了13。其次,当 Conv_A和 Conv_B 的结果进行相加时,由于两个卷积有不同的膨胀系数,将会使得相加的结果携带多尺度信息,U3=U1+U2,(2)式中,U3代表相加的结果。2.3 自适应平均池化 自适应平均池化,即图 2 中的 Sequeeze 操作,公式为U4=1NNi=1U3i,(3)式中,U4代表输出的结果,U3i代表该维度的元素,N 代表该维度元素总量。自适应平均池化的目的是用一个数去表示
12、一个特征通道。2.4 全连接层 图 2 中的 FC 为全连接层,公式为W=convfd(U4),(4)U5=(W),(5)式(4)中,convfd 代表卷积核为 11 的卷积,用于代替全连接层,其作用是将数据的通道从 f 变换到 d,d=max intfr(),L(),(6)式(5)中,代表 RELU 激活函数,代表批归一化函数。式(6)中,r 代表指定的缩小比例,L 是一个指定的实验值,max 代表取最大值,int 代表取整数值。2.5 Softmax 层 图 2 中,Softmax 层的公式为Zi=eiNj=1ej,(7)式中,Zi代表第 i 个节点的输出值,i0,N。U5经过 Softm
13、ax 层,得到归一化的概率值,使得 ai+bi=1。3 MSD-ResNet1D 与迁移学习3.1 MSD-ResNet1D 网络 将 ResNet1D 与 M-SKNet 网络结合在一起,组合成 MSD-ResNet1D 网络,其网络结构和诊断流程如图 3 所示。图3 中,“残差层 M-SKNet”代表的是 M-SKNet与残差层 4(如表 1 所示)的结合。这样的结合方式,使得 M-SKNet 网络在数据进入全连接层之前有选择性地发挥作用,与残差结构防止深度网络性能退化是同理的。42 燕山大学学报2024图 3 MSD-ResNet1D 诊断流程Fig.3 MSD-ResNet1D mod
14、el diagnostic flow3.2 小样本迁移学习 网络模型的训练需要一定的数据量,但实际上在一些工况下数据量短缺,不可能从零开始训练出良好的模型,针对这个问题,本文采用小样本迁移学习14的方式,即以 MSD-ResNet1D 为特征提取网络,以小样本迁移学习为基本框架。4 早停机机制与随机定点取样4.1 早停机机制 在模型的训练中,训练的次数较为依靠专家经验,且模型的训练次数并不是越多越好,次数过多容易造成模型过拟合,也会影响模型的泛化性能。为了解决这个问题,本文引用早停机机制EarlyStop 的思想,并提出一种结合 Metropolis 接收准则的早停机机制构想(Metropol
15、is Early Stop,MES)。Metropolis 准则通常与模拟退火算法相结合,所以也叫退火概率15,公式为PTij=1 E(j)E(i)e-E(j)-E(i)KT E(j)E(i),(8)式中,PTij代表接受的概率,E(i)和 E(j)代表物体在状态 i 和 j 下的内能,T 代表此刻的温度,K 代表玻尔兹曼常数。MES 基本流程如图 4 所示。图 4 中,n 代表第一阶段训练次数,N 代表训练次数上限。L=SAccSLoss,其中 SAcc代表准确率较上次变化的趋势,如果上升,记 3 分,否则记 1分;同理,SLoss代表损失值较上次的变化趋势,如果下降,记 2 分,否则记 1
16、 分。M 准则如下:V=100%L=690%L=370%L=240%L=1,(9)式中,接收值 V 即为模型继续向下训练的概率。图 4 MES 机制基本流程Fig.4 Basic flow of MES mechanism 相较于 Pytorch、TensorFlow 等深度学习框架提供的早停机 API 而言,MES 机制有着更高的灵活性和实际问题针对性,表现在该机制可以根据需求设置和使用。4.2 随机定点取样 传统的按顺序采样(Order Sampling,OS)的数据,由于过多的时序依赖而使模型不可避免地具有较强的思维定式,模型的泛化性能存疑,而实际第 1 期时培明 等 基于注意力机制和深
17、度残差网络的滚动轴承故障诊断43 工况下采集的数据不一定是连续的,具有很强的随机性。为此本文提出一种数据的取样方式 随机定点取样(Random Sampling,RS),取样过程如图 5 所示。图 5 随机定点采样Fig.5 Random sampling 图 5 中,i,j1 且 ij,n,m1 且 nm。这种方式取出的来的数据具有随机、多样以及交叉融合的性质,前后两组数据有一定的相关性,但不一定强,更能模拟出实际工况下取出的数据状态。5 实验5.1 实验数据 选取两个实验平台的滚动轴承振动数据,因为振动信号易于测量和采集,而且包含了丰富的故障信息16。1)凯斯西储大学数据集17,简称 CW
18、RU 数据集。数据集详细信息如下:采样频率为 12 kHz,故障尺寸分别为 0.177 8、0.355 6、0.533 4 mm,负载电机功率分别为 0、1、2、3 hp,测点为驱动端(Driver End,DE)、风扇端(Fan End,FE),数据类别有:内圈故障、外圈故障、滚动体故障、正常。2)江南大学数据集18,简称 JN 数据集。数据集详细信息如下:采样频率为 50 kHz,转速分别为 600、800、1 000 r/min,数据类别与 CWRU 数据集的类别相同。由(1)的表述可知,CWRU 数据每类故障有 3种尺寸,所以故障类别可以分为 10 小类(考虑故障尺寸)或 4 大类(不
19、考虑故障尺寸),且 CWRU数据由于实验平台的原因显得较为理想,为了模拟实际工作环境,以信噪比(Signal to Noise Ratio,SNR)的形式给 CWRU 数据集添加噪声,信噪比的表达式为SNR=10log10PSPN,(10)其中,PS和 PN分别代表信号和噪声的有效功率,通常认为当 SNR0 时,信号处于强噪声环境。5.2 对比模型 为了与同类方法(基于深度学习的方法)在诊断准确率、模型参数量等方面进行对比,选取并搭建一些常用的网络。1)ResNet1D:该网络与 MSD-ResNet1D 相比,仅缺少 M-SKNet。2)ResNet2D:该网络的结构与(1)相同,只是将一维
20、 CNN 换成了二维 CNN。3)LeNet5:该网络是由科学家 Yann Lecun 等人提出19,由二维 CNN、池化层、全连接层组成,选用 RELU 激活函数。4)MLP:搭建多层感知机 MLP 模型,选用Adam 优化器,学习率 0.001,隐藏层数为 5。5.3 实验结果5.3.1 实验一:非变工况实验 训练 MSD-ResNet1D 模型。选取 CWRU 数据集 0HP 工况下 DE 端数据,分 10 个类别,按照随机定点取样的方式,每个类别选取 50 组数据,每组 数 据 包 含 625 个 数 据 点,作 为 训 练 集TrainingSet。不重合地选取一定的数据作为验证集
21、VaildingSet。引入 MES 早停机机制,在该机制内,对模型准确率的需求设置为 95%,达到后允许继续寻优。模型训练时的损失和分类准确率、故障数据召回率随次数的变化如图 6 所示。图 6 训练时各参数的变化Fig.6 The variation of each parameter during training 通过引入 MES 机制,模型仅训练了 33 次。选取不同于 TrainingSet 和 VaildingSet 的数据作为测44 燕山大学学报2024试集 TestingSet,得到模型在 10 类下的准确率为99.1%,在 4 类下的准确率为 99.2%,故障数据召回率、故障
22、数据精确度均为 100%,混淆矩阵如图 7所示。图 7 混淆矩阵Fig.7 Confusion matrix 图 7 中,G1、G2、G3 代表滚动体故障大类,G4、G5、G6 代表内圈故障大类,G7、G8、G9 代表外圈故障大类。使用相同的 TrainingSet 训练其他模型,根据实际的模型情况调整训练次数,分别得到效果最好的各类模型。随机选取测试数据 5 次,分别得到 ResNet1D、ResNet2D、LeNet5,MLP 模型在 10 类别下的准确率均值为(95.40.4)%、(90.60.6)%、(85.40.5)%、(80.90.5)%。可以看出,本文所提模型的诊断准确率最高。各
23、模型参数总量(Params)和浮点运算数(FLOPs)如表 2 所示。表 2 各模型的参数总量和浮点运算数Tab.2 Params and FLOPs for each model本文模型 ResNet1D ResNet2DLeNet5MLPParams/MB0.0070.0100.0200.2770.375FLOPs/GB0.3850.5443.6570.0310.561 由表 2 可以看出,由于组卷积、M-SKNet 网络的使用,MSD-ResNet1D 的参数总量是所提模型中最小 的,浮 点 运 算 数 值 仅 大 于 LeNet5,MSD-ResNet1D 拥有轻量、简便的特点。为了能
24、模拟实际工作环境下的故障诊断情形,给 TestingSet 添加不同程度的信噪比,故障类别分为 4 大类即可,各模型 5 次测量的平均准确率如表 3 所示。加入噪声后,各模型故障诊断的准确率都有所下降,但本文所提模型的平均准确率依然维持最高水平,说明 M-SKNet 的加入使得模型具备更强的特征提取能力和较强的鲁棒性。表 3 噪声下各模型准确率Tab.3 Accuracy of each model under noise%5 dB2 dB0 dB本文模型93.40.385.30.281.20.2ResNet1D83.20.172.70.263.60.3ResNet2D84.60.179.60
25、.275.10.1LeNet553.00.444.30.531.20.4MLP87.70.381.20.275.30.2 使用 JN 数据集,选取转速为 600 r/min 下的数据,训练集 TrainingSet、验证集 VaildingSet、测试集 TestingSet 数据的整理和模型的训练过程不再赘述,得到 MSD-ResNet1D 模型的训练次数为 48次,诊断准确率为 96.5%,故障数据召回率为99.6%。以相同的方式训练其他模型,分别得到ResNet1D、ResNet2D、LeNet5、MLP模 型 在600 r/min 的转速数据下 5 次测试的准确率均值为(93.00.4
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 注意力 机制 深度 网络 滚动轴承 故障诊断
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。