改进掩码自编码器的滚动轴承半监督故障诊断.pdf
《改进掩码自编码器的滚动轴承半监督故障诊断.pdf》由会员分享,可在线阅读,更多相关《改进掩码自编码器的滚动轴承半监督故障诊断.pdf(8页珍藏版)》请在咨信网上搜索。
1、第 45 卷 第 1 期2024 年 1 月仪器仪表学报Chinese Journal of Scientific InstrumentVol.45 No.1Jan.2024DOI:10.19650/ki.cjsi.J2311570收稿日期:2023-06-19 Received Date:2023-06-19基金项目:国家自然科学基金(51975079,62073051)、重庆市教委科学技术研究项目(KJZD-M202200701)、重庆市研究生联合培养基地项目(JDLHPYJD2021007)、重 庆 市 自 然 科 学 基 金 创 新 发 展 联 合 基 金(CSTB2023NSCQ-L
2、ZX0127)、重 庆 市 专 业 学 位 研 究 生 教 学 案 例 库(JDALK2022007)、重庆市研究生科研创新项目(2023S0072)资助改进掩码自编码器的滚动轴承半监督故障诊断陈仁祥1,张 晓1,张 旭1,赵 玲1,夏 亮2(1.重庆交通大学交通工程应用机器人重庆市工程实验室 重庆 400074;2.重庆智能机器人研究院 重庆 400714)摘 要:针对滚动轴承在不同转速条件下数据分布不同以及实际工程应用中标签样本不足导致故障诊断精度低的问题,将领域适配模块融入掩码自编码器(MAE)中,提出了改进掩码自编码器(IMAE)的滚动轴承半监督故障诊断方法。首先,对滚动轴承振动信号进
3、行连续小波变换(CWT)得到反应信号时频特征的二维时频图,然后对时频图随机掩码,利用无标签样本进行掩码自编码器预训练,获得数据中复杂的内在特征,减少对有标签样本的依赖;其次将领域适配模块引入到预训练后的编码器中,使用少量有标签源域数据对 IMAE 进行微调,在希尔伯特空间中利用最小化最大均值差异减小因转速不同造成的源域与目标域间数据分布差异;最后在 Softmax 分类层下实现滚动轴承半监督故障诊断。通过滚动轴承数据集实验验证,所提方法检测精度均达到 94%以上,证明了该方法的可行性与有效性。关键词:掩码自编码器;滚动轴承;不同转速;标签样本;半监督故障诊断中图分类号:TH165+.3 TH1
4、7 文献标识码:A 国家标准学科分类代码:510.40Improved semi-supervised fault diagnosis of rolling bearings with mask autoencoderChen Renxiang1,Zhang Xiao1,Zhang Xu1,Zhao Ling1,Xia Liang2(1.Chongqing Engineering Laboratory for Transportation Engineering Application Robot,Chongqing Jiaotong University,Chongqing 400074,C
5、hina;2.Chongqing Robotics Institute,Chongqing 400714,China)Abstract:To address the problems of different data distribution of rolling bearings under different speed conditions and low fault diagnosis accuracy caused by insufficient label samples in practical engineering applications,the domain adapt
6、ation modules are integrated into masked autoencoders(MAE).An improved masked autoencoders(IMAE)method for semi-supervised fault diagnosis of rolling bearings is proposed.Firstly,the two-dimensional time-frequency graph of the response signal is obtained by applying continuous wavelet transform(CWT)
7、to the vibration signal of the rolling bearing.Then,the mask of the time-frequency graph is randomly masked,and the mask autoencoder is pre-trained with unlabeled samples to obtain the complex intrinsic features of the data.The reliance on labeled samples is reduced.Secondly,the domain adaptation mo
8、dule is introduced into the pre-trained encoder,and a small amount of labeled source domain data are used to fine-tune the IMAE,and the maximum mean difference is minimized in Hilbert space to reduce the data distribution difference between the source domain and the target domain caused by different
9、 rotational speeds.Finally,the semi-supervised fault diagnosis of rolling bearing is realized under the Softmax classification layer.Through the experimental evaluation of the rolling bearing data set,the detection accuracy of the proposed method is more than 94%,which proves the feasibility and eff
10、ectiveness of the proposed method.Keywords:mask autoencoder;rolling bearing;different speed;sample label;semi-supervised fault diagnosis 第 1 期陈仁祥 等:改进掩码自编码器的滚动轴承半监督故障诊断27 0 引 言 滚动轴承作为广泛应用的基础零部件,其工作状态直接影响着整台设备的正常运行,在旋转机械中有举足轻重的作用1-2,对其进行故障诊断具有重要意义。随着人工智能技术飞速发展和大数据时代来临,基于数据驱动的故障诊断方法在滚动轴承中得到了广泛应用。王鸽等3提
11、出了一种改进多尺度深度卷积神经网络,提高了模型的判别性特征提取能力。池福临等4构建深度收缩残差网络与迁移学习的诊断模型,在转速变化和有噪声干扰时取得了较好效果。康守强等5提出一种改进的深度 Q 网络进行数据不平衡和跨负载工况下滚动轴承故障识别。陈仁祥等6提出基于深度注意力迁移学习的滚动轴承故障诊断方法,实现了不同转速下滚动轴承深度特征的迁移适配。尽管以上研究在故障诊断方面取得了较好效果,但均在有标记样本充足的数据集上进行实验验证,依赖于大量标记样本的监督训练。而实际工程中,设备长期处于正常工作状态,获取大量有标记故障样本十分耗时且昂贵,导致数据集含有大量无标注数据;此外,有标记样本稀缺而无法提
12、供足够的监督训练时,深度学习模型容易过拟合,导致故障诊断效果较差。近年来,有标签样本不足的故障诊断问题受到了许多学者的关注。目前用于解决标签样本不足的方法主要包括数据增强和迁移学习。数据增强通过对训练样本进行扩充以提高模型的泛化能力,黄南天等7搭建了一种改进辅助分类生成对抗模型,并生成大量与真实数据分布近似的虚假样本。迁移学习可将在源域标签数据下学习到的知识迁移应用到其他相关的领域,通过在其他域中获得的具有公共特征提取的模型来提高模型的泛化能力。张西宁等8提出了基于迁移学习的小样本轴承故障诊断方法,在仅有少量目标域数据的情况下也能取得很高的诊断准确率。上述方法虽在样本不足时有较好表现,但其自身
13、还有局限,如生成对抗网络训练困难,容易导致模型梯度消失,而迁移学习难以衡量源域和目标域之间的数据分布差异,且要求源域需要大量标签数据训练模型。半监督学习在少量标签样本的基础上,配合大量无标签样本完成模型训练,既避免了样本量不足时深度学习精度不高的问题,又克服了标签样本匮乏的难题。为解决不同转速条件下数据分布不同以及标签样本不足导致滚动轴承故障诊断精度低的问题,提出改进掩码自编码器(improve masked autoencoders,IMAE)的半监督故障诊断方法。首先,利用连续小波变换(continuous wavelet transform,CWT)得到反应信号时频特征的二维时频图,然后
14、对时频图随机掩码,利用无标签样本进行掩码自编码器(masked autoencoders,MAE)预训练,获得数据中复杂的内在特征,减少对有标签样本的依赖;其次将领域适配模块引入到预训练后的编码器中,使用少量有标签源域数据对 IMAE 进行微调,在希尔伯特空间中利用最小化最大均值差异(max mean discrepancy,MMD)减小因转速不同造成源域与目标域间数据分布差异;最后在Softmax 分类层下实现滚动轴承半监督故障诊断。1 IMAE 原理 所建立 IMAE 半监督网络结构如图 1 所示,包含预训练网络和微调网络两部分。预训练网络包括多个MAE,微调网络结构由训练完成的编码器、领
15、域适配模块以及 Softmax 分类层构成。图 1 改进掩码自编码器网络结构Fig.1 Improved mask autoencoder network structure1.1 MAE 原理 MAE 是一种非对称编码器-解码器结构,其中编码器只在未掩码的 patches 上工作,而解码器则负责结合掩码 patches 从隐藏空间重构图像9,如图 2 所示。在掩码处理层完成对样本的部分特征随机掩盖操作后,利用样本的部分特征预测被掩盖掉的特征以训练自编码器,使得自编码器尽量保留样本结构特征信息。图 2 掩码自编码器网络结构Fig.2 Mask autoencoder network struc
16、ture1)掩码处理掩码处理(图 3)能把原始故障样本处理成更多的新训练样本,也能给正常样本添加额外的约束,从而更好获得数据本身的深层结构特征信息10。在输入端,被掩码的数据和未被掩码的数据一起输入神经网络。在输出端,被掩码的原始信号作为解码器输出的监督信号。通28 仪 器 仪 表 学 报第 4 5 卷过这种简单的变换,故障数据可以成倍添加至训练集中,更好地完成模型的学习与训练。图 3 掩码处理示意图Fig.3 Schematic diagram of mask2)编码器编码器采用视觉自注意力模型(vision transformer,VIT)将输入信息映射到某个更低维度的空间,其仅对未屏蔽
17、patches 进行操作。编码器依据原始数据通过位置编码后的有效值提取特征,并输出相应的特征向量到解码器。其计算公式为:z=fenc(x)=f(1x+b1)(1)式中:x 是原始数据;fenc()为编码器模型;z 是编码器网络输出的样本编码;w1是编码器的权重矩阵;b1为编码器的偏置向量。3)解码器解码器将特征编码重构为原输入,其最后一层是线性投影层,它输出的通道数等于图像的像素数。因此,解码器的输出将被进一步重塑为原始图像的形状。x=fdec(z)=f(2z+b2)(2)式中:x 是解码器输出的预测原本被淹没位置的部分信息特征;fdec()是解码器模型;2是解码器权重矩阵;b2为解码器偏置向
18、量。损失函数使用均方误差(mean square error,MSE)直接最小化重建图像 x 和原始图像 x 之间的距离。L(x,x)=x-x22(3)1.2 微调网络 微调网络由预训练后的编码器、领域适配模块以及Softmax 分类层构成。为减小因转速变化导致数据分布差异,引入领域适配模块利用源域与目标域特征之间的MMD 距离作为两域之间损失,通过最小化 MMD 距离来减小源域与目标域之间的差异,其计算公式为:MMD2(Ds,Dt)1n1n1i=1(xi)-1n2n2j=1(xj)2H(4)式中:Ds表示给定标记源域;Dt表示给定未标记目标域;xi和 xj分别表示源域和目标域样本;n1和 n
19、2分别表示源域和目标域的样本数量;H是具有特征核k 的再生核希尔伯特空间(RKHS)。其中,()表示将原始样本映射到RKHS 的一些特征映射。在微调过程中将目标域数据和源域数据共同输入到无解码器的网络中,以在编码器中学习通用特征表示。然后,从各层的输出中提取特征并计算 MMD 领域分布差异。将 MMD 加入到微调模型的目标损失函数中,通过同步训练更新权重,提高领域适配效率。1.3 损失函数 损失函数由两部分构成,用 L(x,)表示对于数据 x关于参数 的损失函数,表达式为:l(x,)=Nn=1L1(x,x;1,2)+L2(p(c x);1,3,4)+L3(c x);1,2,3,4)(5)式中:
20、L1为重构阶段的损失函数;x 表示原始数据;x 表示重构数据;L2为故障诊断 网 络 中 分 类 损 失 函 数;p(c|x)表示数据掩码后编码器输出结果;1、3和 4分别为该网络中的权值矩阵;L3为 1、2、3和 4这4 组参数联合构成的正则化损失函数;(c x)表示数据未掩码部分编码器输出结果。L=L(x,y)+MMD2(Ds,Dt)(6)式中:L 表示微调阶段用于监督模型训练的损失函数,采用交叉熵损失函数;表示权重系数。通过最小化预测的掩码信息、原始样本掩码信息的距离、故障诊断网络的分类损失以及领域适配模块中 MMD 最小化,完成网络的训练。2 诊断流程 改进掩码自编码器的滚动轴承半监督
21、故障诊断分为3 个主要步骤,信号预处理并划分数据集、模型设计与训练和故障分类识别,流程如图 4 所示。1)信号预处理并划分数据集。获取滚动轴承故障振动信号,利用 CWT 获得时频图,划分训练集(源域)和测试集(目标域),构建样本集。2)构建 IMAE 网络模型,设置网络初参数。通过批量的方式将无标签数据(预训练数据)输入掩码自编码器网络中,通过式(3)的目标损失函数对 MAE 模型的参数进行更新,实现 MAE 无监督预训练。3)重复步骤 2),直至网络收敛,完成 MAE 的预训练,得到训练完成的编码器。4)将具有少量标签的源域数据和目标域数据输入训练好的编码器,对预训练后的网络进行微调,通过领
22、域适配模块中的 MMD 对源域与目标域特征进行适配,减小因转速不同导致的特征分布差异。5)运用训练完成的模型对测试集进行分类识别,最终得出故障诊断结果。第 1 期陈仁祥 等:改进掩码自编码器的滚动轴承半监督故障诊断29 图 4 方法流程Fig.4 Flow chart of method3 实验验证3.1 实验数据 实验数据来自机械故障综合模拟实验台,由电机、联轴器、滚动轴承等组成,如图 5 所示。采用 er-16k 型深沟球轴承进行实验,轴承节径 1.516 in(1 in=25.5 mm),包含 9 个滚动体,接触角 9.08。图 5 轴承故障模拟试验台Fig.5 Bearing faul
23、t test rig采集时转速分别为 A 工况 1 000 r/min;B 工况 1 200 r/min;C 工况1 400 r/min。加载负荷均为5 kg,采样频率为 25.6 kHz。所设置的滚动轴承四种故障类型分别为内圈故障(I)、外圈故障(O)、滚动体故障(B)、正常(N)。3.2 数据集构建 在机械装备实际运行中,历史数据中含有大量的无标签样本和少量的有标签样本11。为验证所提方法在有标签训练标签样本不足、变转速下故障诊断效果,每种故障分别选取 30 个标签样本作为训练集,100 个样本作为测试集,每段采样点设置为 1 024 个。试验数据集分别如表 1 所示。表 1 滚动轴承数据
24、集Table 1 Rolling bearing data set故障类型正常内圈外圈滚动体标签0123转速/(r min-1)ABC训练集30303030测试集100100100100训练集30303030测试集100100100100训练集30303030测试集1001001001001 0001 2001 4004 实验结果及分析 试验基于 PyCharm2020.1.3 中的 pycorch 框架,硬件环境 为 AMD Ryzen 7 4800 H with Radeon Graphics 2.90 GHz 双处理器和 NVIDIA Quadro P3060 显卡。训练过程采用 Ada
25、m 优化器对参数进行优化,学习率为0.001,迭代次数为 200,Batch-size 设置为 16,为防止网络过拟合,设置 dropout 数值为 0.5,模型具体参数如表 2 所示。将所提方法 IMAE 与 MAE、深度网络自适应(deep domain confusion,DDC)12、残 差 神 经 网 络(residual networks,ResNet)13、深度适配网络(deep adaptation network,DAN)14、卷积神经网络+支持向量机(CNN+SVM)、深度置信网络(deep belief networks,DBN)15-16和自监督预训练对比学习(self
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 改进 掩码 编码器 滚动轴承 监督 故障诊断
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。