基于改进CNN和Kmeans的双转子轴承半监督故障诊断.pdf
《基于改进CNN和Kmeans的双转子轴承半监督故障诊断.pdf》由会员分享,可在线阅读,更多相关《基于改进CNN和Kmeans的双转子轴承半监督故障诊断.pdf(10页珍藏版)》请在咨信网上搜索。
1、第 43 卷第 5 期2023 年 10 月振动、测试与诊断Vol.43 No.5Oct.2023Journal of Vibration,Measurement&Diagnosis基于改进CNN和Kmeans的双转子轴承半监督故障诊断崔锦淼1,贺雅1,2,冯坤1,2(1.北京化工大学发动机健康监控及网络化教育部重点实验室北京,100029)(2.北京化工大学高端机械装备健康监控与自愈化北京市重点实验室北京,100029)摘要 针对双转子轴承复杂信号故障特征难提取、工程中某些类型的故障数据缺乏时卷积神经网络(convolution neural network,简称 CNN)难训练的问题,提出
2、一种基于改进 CNN 和 Kmeans的双转子轴承半监督故障诊断方法。首先,利用自回归(autoregressive,简称 AR)模型对双转子轴承信号去噪,并基于傅里叶变换得到信号频谱作为CNN 输入;其次,以 Morlet小波基频域函数作为激活函数构建 CNN,结合 Softmax损失和提出的权重内积最小化损失在少类别训练数据下训练 CNN;最后,基于 Kmeans聚类算法分析 CNN 线性输出确定无标签数据伪标签,并结合半监督学习中自训练思想迭代 CNN 更新伪标签,继而依据伪标签划分双转子轴承正常、已知故障和未知故障状态。利用双转子轴承故障模拟试验台数据进行验证,结果表明,在少类别训练数
3、据下,其诊断效果相较于人工神经网络(artificial neural network,简称 ANN)等方法更佳,诊断准确率达到了 100%,验证了所提方法的有效性。关键词 双转子轴承;故障诊断;卷积神经网络;自回归模型;Kmeans聚类;半监督学习中图分类号 TH133.33;TP277引 言双转子轴承是一种特殊的滚动轴承,其内外圈均与转子相连,以减轻重量获得紧凑结构,被广泛用于燃气轮机等双转子设备中1。作为双转子设备关键支撑部件之一,双转子轴承的可靠性直接影响设备的稳定健康运行,因此对其进行状态监测和故障诊断十分必要,其中振动监测是最常用的手段23。双转子轴承内外圈均转动,无固定轴承座,振
4、动信号只能在设备机匣间接采集,因此其振动信号相较于普通滚动轴承更为复杂。艾延廷等4利用局部包络谱峰值因子优化 Morlet复小波,然后对双转子轴承振动信号滤波,提取双转子轴承微弱故障。Jiang 等5利用 AR 对双转子轴承振动信号进行去噪,基于快速谱峭度方法确定中心频率和带宽,并对信号再次滤波,共振解调得到包络信号,最后对包络信号角域重采样,提取双转子轴承阶次特征。上述方法虽然在一定程度上增强了双转子轴承微弱故障特征,但严重依赖专家诊断知识,智能化水平低。为了减轻故障诊断对信号处理技术及专家诊断知识的依赖,提高故障诊断智能化水平,缩短诊断维修周期,CNN 等端到端的深度学习技术逐渐应用于故障
5、诊断领域6。王奉涛等7提出一种基于 CNN 的双转子轴承故障诊断方法,对轴承振动信号进行灰度变换后输入 CNN 进行诊断。王丽华等8以短时傅里叶变换后的时频谱图作为 CNN输入来进行诊断故障。基于 CNN 的有监督诊断方法,需要一定数量的各类轴承故障数据。工程实际中,轴承某些故障类型数据不易获取,限制了上述方法的工程应用。半监督深度学习利用标签数据和无标签数据共同训练网络,一定程度上减弱了网络训练对标签数据的依赖。Li等9提出基于数据增强和深度稀疏自动编码器的半监督故障诊断方法,减小了网络训练对有标签数据数量的要求,但是网络微调仍需各类别的故障数据支撑。Lee10提出伪标签自训练的半监督深度学
6、习方法,在一定程度上摆脱了测试集类别数不能大于训练集类别数的限制。笔者提出一种基于改进 CNN 和 Kmeans 的双转子轴承半监督故障诊断方法。该方法基于 AR 预处理双转子轴承振动信号,以频谱幅值序列作为改进 CNN 输入,基于自训练思想在少类别训练数据下诊断双转子轴承故障,减小了网络训练对有标签故障数据的依赖,工程应用价值更高。1 方法原理1.1自回归模型AR 是一种常见的滚动轴承振动信号去噪预处DOI:10.16450/ki.issn.10046801.2023.05.015 NSFC辽宁联合基金重点资助项目(U1708257);国家重点研发计划资助项目(2017YFC0805702)
7、收稿日期:20210323;修回日期:20210530振 动、测试与诊断第 43 卷 理方法5,可预测振动信号中平稳信号成分。从原始振动信号中剔除平稳信号成分即可获得滚动轴承非平稳振动信号,其原理如下。通过 t时刻前 p个数据预测 x(t)数据值,即x(t)=-i=1paix(t-i)(1)其中:x(t-i)为 t 时刻前第 i 个数据值;ai为 x(t-i)对应的系数;x(t)为 t时刻预测值。x(t)为平稳信号成分,从原始信号中剔除平稳信号成分即可获得轴承非平稳冲击信号e(t)=x(t)-x(t)=x(t)+i=1paix(t-i)(2)展开式(2)可得e(t)=x(t)+a1x(t-1)
8、+a2x(t-2)+apx(t-p)(3)e(t)可以看成滤波器系数 a(p)=1,a1,ap在时间序列 x(t)=x(t),x(t-1),x(t-p)上的卷积,其中 AR 滤波器系数 a(p)可通过 YuleWalker方程求解5。1.2权重归一化卷积神经网络卷积神经网络是一种集特征提取与分类于一体的深度学习方法,其兴起于计算机视觉和语音识别领域,并逐步应用在设备智能故障诊断中11。卷积神 经 网 络 随 输 入 数 据 维 度 可 分 为 1DCNN 和2DCNN,其中 1DCNN 更适用于振动波形和频谱等1维输入数据序列。典型的 1DCNN 结构示意如图 1所示,包括卷积层、池化层和全连
9、接层。为加速网络收敛,Salimans 等12提出权重归一化方法加速网络训练过程中权重调整。Jia 等13将权重归一化卷积神经网络应用于故障诊断领域,进一步验证该方法的有效性。权重归一化卷积神经网络通过约束卷积核和全连接层权重模长,加速随机梯度下降算法对卷积核和全连接层权重在空间方向上的调整,从而加速网络收敛,其原理如下。1)卷积层:利用卷积核在输入上滑动卷积自动提取数据特征,通过局部连接实现权值共享,相较于全连接结构大大减小了网络参数数量。其中,一个卷积核作用于输入得到的特征称为一个特征图,其前向计算公式为yki=fc(kj=1nl=1mwkj,lwk2xj,l+step*(i-1)+bk)
10、(4)其中:step 为卷积层的步长;wk为第 k 个 nm 的卷积核;|wk|2为第 k个卷积核的欧几里得范数;k为卷积核 wk对应的偏移系数;n 为卷积层输入特征图的个数(第 1层卷积层中 n=1);m 为卷积核长度;bk为第 k 个卷积核对应的偏置;fc()为卷积层的激活函数;yik为第 k个特征图中第 i个节点的输出。2)池化层:通过下采样约减数据特征维度,提高网络的鲁棒性。常用的池化方式有最大池化和平均池化,本研究选取的平均池化前向计算公式为yki=r=1stepxk,r+step*(i-1)step(5)其中:step 为池化层的步长;xk为池化层第 k 个输入特 征 图;yik为
11、 池 化 层 第 k 个 特 征 图 第 i 个 节 点 的输出。池化层输入特征图个数等于输出特征图个数。3)全连接层:通过全连接结构将网络学习的分布式特征映射到样本标记空间,起到分类器的作用,其前向计算公式为yi=ff(ij=1mwi,jwi2xj+bi)(6)其中:wi,j为全连接层第 i个输出节点与第 j个输入节点的连接权重;wi为所有输入节点与第 i 个输出节点的权重向量;|wi|2为 wi的欧几里得范数;i为 wi对应的偏移系数;xj为第 j个输入节点值;m 为输入节点个数;bi为偏置,ff()为激活函数;yi为第 i个节点输出值。1.3基于自训练的半监督深度学习故障诊断领域故障数据
12、获取困难,半监督深度学习相较于有监督学习对标签训练数据依赖更小。基于自训练的半监督深度学习示意如图 2 所示,其基于少量有标签数据预训练网络,利用大量无标签数据进行测试,并生成无标签数据的伪标签,结合标签和伪标签数据迭代网络,摆脱了测试集类别数不能大于训练集类别数的限制,应用价值更高10,14。如何确定无标签数据的伪标签是算法关键,聚类分析是常用方法之一。Kmeans 算法是一种典型的利用统计方法来分析数据分布特性的无监督学习算法,通过 Kmeans 分析 CNN 线性输出,可初步判断图 1典型的 1DCNN结构示意图Fig.1Structure of typical one dimensio
13、nal CNN946第 5 期崔锦淼,等:基于改进 CNN和 Kmeans的双转子轴承半监督故障诊断无标签数据对应的伪标签,其聚类数 K 可通过轮廓系数(silhoutte coefficient,简称 SC)来确定15。SC是衡量聚类效果的重要指标之一,单个样本的 SC计算公式为sci=(ai-bi)/max(ai,bi)(7)bi=1Nk-1j=1Nk-1xi-xj2 (xi ck,xj ck)(8)ai=1M-Nkj=1M-Nkxi-xj2 (xi ck,xj ck)(9)其中:M 为样本总数;bi为第 i个样本与同类样本的平 均 距 离;ai为 第 i 个 样 本 与 不 同 类 样
14、本 的 平 均距离。样本集合的 SC为所有样本 SC的均值,即SC=1Mi=1Msci(10)SC越大,则表示数据类内紧凑,类间距离大,聚类效果越好。通过比较各 K 值下 SC 的大小,以 SC随 K变化的转折点作为最佳聚类数 K值。2 本研究提出的方法2.1改进 CNN为进一步提升 CNN 从双转子轴承数据中提取复杂非线性特征的能力,笔者从激活函数和损失函数两方面改进 CNN。从故障诊断角度选取非线性程度高且与 CNN 输入更相关的函数作为激活函数,从 CNN 内积运算的数学角度约束权重向量以增加权重多样性。2.1.1Morlet小波频域激活函数激活函数通过非线性激励神经网络,可拟合出任何复
15、杂的非线性关系。各激活函数及导数如图 3所示,其中 Sigmoid 和 Tanh 因导数计算简单被广泛应用,但其响应区间小,输出范围窄,仅在 0,1 和-1,1 范围内输出,且随着网络层数的加深易造成梯度弥散,增加了网络训练难度16。Relu 和 Leakyrelu 激活函数在一定程度上解决了 Sigmoid 和 Tanh的梯度弥散问题,但非线性程度低,仅在正负半轴具备不同斜率,不利于提取双转子轴承振动信号中的复杂非线性特征。文献 17 在以时域波形作为输入时,以非线性更强的 Morlet小波时域函数作为激活函数,增强了网络非线性特征提取能力,提升了故障诊断效果。笔者在以频谱幅值序列作为 CN
16、N 输入时,相应的以 Morlet小波频域函数(Morlet wavelet frequency domain function,简称MoretFDF)作为激活函数。1)频谱中包含有部件故障特征频率及特征频带等相关信息,相较于时域波形故障特征更直观,且数据内存小(一般情况下只考虑幅值谱,为时域的一半)。Xu 等18将图像变换至频域,以频域特征作为输入,相较于直接以空间域图像作为输入,在相同精度下大幅降低计算成本,验证了频谱特征的有效性。2)Morlet 及 MorletFDF 激活函数计算公式如表 1 所示。a=1,b=0 时的激活曲线及导数见图 3。相较于传统激活函数,该函数具有以下优点:是
17、Morlet小波的频域响应,非线性程度更高,且曲线为单瓣,与冲击信号频谱最相似,频谱中主要信息位于窗函数效应的主瓣中,该种响应曲线可能更契合频谱输入;是可变尺度自适应激活函数,自适应平移系数 b通过调节激活函数的响应区间保留频谱有效频段特征,自适应缩放因子 a 通过调节激活函数响应宽度及平滑度放大有效频段特征,更有利于 CNN图 2基于自训练的半监督深度学习示意图Fig.2Schematic diagram of semi-supervised deep learning based on self-training表 1常用激活函数计算公式Tab.1Calculation formula o
18、f activation function and its derivative激活函数MorletMorletFDF公式导数公式导数计算式f(x)=cos(f0 x)e-x22f(x)=-(f0sin(f0 x)+x cos(f0 x)e-x22f(x)=2 e-(x-b)22af(x)=-2(x-b)a)e-(x-b)22a图 3各激活函数及导数Fig.3Activation function and derivative curve947振 动、测试与诊断第 43 卷 自提取故障相关特征。2.1.2权重内积最小化损失Ayinde 等19通过设定卷积核间余弦相似度阈值,建立卷积核间相似度惩
19、罚机制,提高网络各层特征提取的多样性,但卷积核间余弦相似度惩罚阈值难以设定,阈值过大达不到效果提升,阈值过小则易欠拟合。笔者结合网络权重归一化约束1213,在文献 19 基础上提出网络权重内积最小化损失。权重归一化约束通过规范权重的模长加速单位权重向量在空间方向上的调整,权重内积最小化损失则通过惩罚单位权重向量内积,增大各单位权重向量在空间上的角度,使不同权重向量提取的特征方向尽可能不同,以增强 CNN特征提取的多样性。卷积神经网络权重内积最小化损失计算公式为L=12lLl=12l(i=1Nj=1NLli,j,i j)(11)其中:l为卷积层或全连接层层数;N 为 l层中卷积核或权重向量个数;
20、Lli,j为 l层第 i和第 j个卷积核或权重向量间内积;Ll为 l层权重内积损失。对于卷积层则有Lli,j,i j=wi/wi2 wj/wj2(12)Lwwi=Llwi=j=1,j iNwjwiwj-wiwi2Lli,j(13)对于全连接层则有Lli,j,i j=wi/wi2 wj/wj2(14)Lwi=Llwi=j=1,j iNwjwiwj-wiwi2Lli,j(15)选取 Softmax损失函数,网络最终损失函数为L=Ls+Lw=-i=1Mtiln(yi)+2l(i=1Nj=1NLli,j,i j)(16)其中:为 Ls,Lw损失间的系数;M 为训练样本数。可自适应给定,即l=|dlLs
21、|dlLw(17)其中:l为第 l层 参数;|dlLs为第 l层 Ls损失对应梯度绝对值之和;|dlLw为第 l层 Lw损失对应梯度绝对值之和。通过系数 l保证第 l层 Ls损失和 Lw损失梯度数量级接近,从而保证网络收敛。2.2基于改进 CNN 和 Kmeans 的双转子轴承半监督故障诊断方法本研究以双转子轴承为研究对象,提出一种基于改进 CNN 和 Kmeans 的半监督故障诊断方法,如图 4所示,其基本步骤如下。1)振动数据预处理:利用双转子轴承正常状态下振动数据求解 AR 滤波器系数 a(p),基于 a(p)对所有振动数据滤波去噪。对滤波后的时域波形进行傅里叶变换,得到 1维频谱序列,
22、并将数据划分为训练集和测试集。其中:训练集包含有标签正常数据Dn1和有标签故障数据 Df1;测试集包含正常数据 Dn2、已知故障类型数据 Df2和未知故障类型数据 Du。2)CNN 故障特征提取模型构建:根据样本频谱序列长度确定 1DCNN 结构参数,基于提出的MorletFDF 激活函数及权重归一化方法构建 MFCNN故障特征提取模型。3)模型预训练:基于有标签的训练集数据 Dn1和 Df1,结合提出的权重内积最小化和 Softmax损失,迭代训练 MFCNN 故障特征提取模型。4)双转子轴承故障诊断:将训练集数据 Dn1,Df1和测试集数据 Dn2,Df2,Du输入 MFCNN,得到 MF
23、CNN 线 性 输 出 特 征。基 于 Kmeans 算 法 对 MF CNN 输出特征聚类,计算各聚类数 K(Kk,k 为训练集数据类别)下的 SC值,选取最大 SC值对应的 K值作为最终聚类数,得到最终聚类结果,即无标签数据伪标签。利用有标签训练数据和伪标签测试数据共同迭代网络,直至伪标签连续 3 次变化小于 5%,即认为伪标签最吻合测试集真实标签,从而判别测试集样本状态。图 4基于改进 CNN和 Kmeans的半监督故障诊断方法Fig.4The semi-supervised fault diagnosis method based on improved CNN and Kmeans9
24、48第 5 期崔锦淼,等:基于改进 CNN和 Kmeans的双转子轴承半监督故障诊断当模型诊断出未知故障时,通过专家诊断确定故障类别后,可对未知故障数据重新标记以扩充故障数据库。3 试验验证3.1试验台介绍双转子轴承故障模拟试验台如图 5 所示,利用相关数据验证所提方法的有效性。试验台主要由电主轴(外)、联轴器、轴承座、双转子轴承、普通滚动轴承、轴承座、联轴器及电主轴(内)组成。由于双转子轴承内外圈不固定,无法直接安装传感器,因此只能在临近的#2 轴承座上安装振动加速度传感器。振动信号通过转子传递至#2轴承,然后传递至 2#轴承座,传递路径相较于普通滚动轴承更为复杂。以 LMS Test.La
25、b振动测试系统采集双转子轴承在正常(N)、外圈故障(OF)、内圈故障(IF)及滚动体故障(RF)下轴承座处外侧垂直方向的加速度信号,其中加速度传感器型号为 BK4519,采样频率为 25.6 kHz。选取内圈转速为 900 r/min、外圈转速为 1 500 r/min工况下的轴承数据组成验证数据集,为模拟实际中有标签故障数据类别缺乏现象,选取正常数据、某一类轴承故障数据或干扰噪声数据(IN)构成训练集,正常数据和所有轴承故障数据构成测试集,数据集组成如表 2所示。3.2数据去噪预处理冲击调制是滚动轴承发生局部故障的重要特征,滚动体转过滚动轴承缺陷处会产生瞬时冲击,同时激起轴承固有振动产生幅值
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 改进 CNN Kmeans 转子 轴承 监督 故障诊断
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。