基于核熵成分分析的工业过程故障诊断.pdf
《基于核熵成分分析的工业过程故障诊断.pdf》由会员分享,可在线阅读,更多相关《基于核熵成分分析的工业过程故障诊断.pdf(9页珍藏版)》请在咨信网上搜索。
1、收稿日期:2 0 2 2 1 1 2 1基金项目:国家自然科学基金资助项目(6 2 2 7 3 2 4 2)。作者简介:李 榕(1 9 9 8),女,陕西宝鸡人,硕士研究生。通信作者:李 元(1 9 6 4),女,辽宁沈阳人,教授,博士生导师。E-m a i l:l i-y u a n m a i l.t s i n g h u a.e d u.c n。第3 5卷 第5期2 0 2 3年 1 0月沈阳大学学报(自然科学版)J o u r n a l o fS h e n y a n gU n i v e r s i t y(N a t u r a lS c i e n c e)V o l.3
2、5,N o.5O c t.2023文章编号:2 0 9 5-5 4 5 6(2 0 2 3)0 5-0 3 9 7-0 9基于核熵成分分析的工业过程故障诊断李 榕,李 元(沈阳化工大学 信息工程学院,辽宁 沈阳 1 1 0 1 4 2)摘 要:针对实际工业过程数据往往具有高斯与非高斯共存、非线性的特点,及传统核主成分分析在特征提取时仅考虑变量方差最大化导致信息丢失,并且处理非高斯数据能力欠佳,因此传统核主成分在故障诊断分析中难以取得令人满意的结果的问题,提出一种核熵成分分析(k e r n e le n t r o p yc o m p o n e n ta n a l y s i s,K E
3、 C A)、余弦相似度K均值(K-m e a n s o f c o s i n e s i m i l a r i t y,C S K)的故障诊断方法。首先将数据投影至高维空间,K E C A方法根据R e n y i熵大小选取投影方向,对数据进行降维;然后,基于K E C A能够以角结构方式捕捉数据内部的集群结构信息,设计一种余弦相似度的K均值聚类器,对数据进行聚类并建立故障诊断模型;最后,将K E C A-C S K方法应用于田纳西 伊斯曼化工过程进行仿真实验。结果表明:与核主成分聚类分析相比,K E C A-C S K方法具有更好的诊断结果,验证了所提方法的优越性。关 键 词:故障诊断
4、;核熵成分分析;R e n y i熵;特征提取;田纳西 伊斯曼过程中图分类号:T P 2 7 7 文献标志码:AF a u l tD i a g n o s i so f I n d u s t r i a lP r o c e s sB a s e do nK e r n e lE n t r o p yC o m p o n e n tA n a l y s i sL IR o n g,L IY u a n(D e p a r t m e n to fI n f o r m a t i o nE n g i n e e r i n g,S h e n y a n gU n i v e r
5、s i t yo fC h e m i c a lT e c h n o l o g y,S h e n y a n g1 1 0 1 4 2,C h i n a)A b s t r a c t:A c t u a l i n d u s t r i a l p r o c e s sd a t ao f t e nh a v et h ec h a r a c t e r i s t i c so fG a u s s i a na n dn o n-G a u s s i a nc o e x i s t e n c ea n dn o n l i n e a r i t y,a n dk
6、 e r n e l p r i n c i p a l c o m p o n e n t a n a l y s i s(K P C A)o n l yc o n s i d e r st h em a x i m i z a t i o no f v a r i a b l ev a r i a n c e i n f e a t u r e e x t r a c t i o n,r e s u l t i n g i n i n f o r m a t i o nl o s s,a n dt h ea b i l i t yt op r o c e s sn o n-G a u s
7、s i a nd a t ai sn o tg o o d,s oi ti sd i f f i c u l tt oa c h i e v es a t i s f a c t o r yr e s u l t si nf a u l td i a g n o s i sa n a l y s i s.I nv i e w o ft h ea b o v ep r o b l e m s,af a u l td i a g n o s i sm e t h o do fk e r n e le n t r o p yc o m p o n e n ta n a l y s i s(K E C
8、 A)a n d K-m e a n so fc o s i n es i m i l a r i t y(C S K)w a sp r o p o s e d.F i r s t l y,t h ed a t aw a sp r o j e c t e d i n t oah i g h-d i m e n s i o n a l s p a c et os e l e c t t h ep r o j e c t i o nd i r e c t i o na c c o r d i n gt ot h eR e n y ie n t r o p yt or e d u c et h ed
9、 i m e n s i o no ft h ed a t a;t h e n,K E C Ac a nc a p t u r et h ec l u s t e rs t r u c t u r ei n f o r m a t i o ni n s i d et h ed a t ai na na n g u l a rs t r u c t u r e,a K-m e a n so fc o s i n es i m i l a r i t y w a sd e s i g n e dt oc l u s t e rt h ed a t aa n dc o n s t r u c t t
10、 h ef a u l td i a g n o s i sm o d e l.F i n a l l y,t h eK E C A-C S K m e t h o dw a sa p p l i e dt ot h eT e n n e s s e e-E a s t m a nc h e m i c a l p r o c e s s f o r s i m u l a t i o ne x p e r i m e n t s.S i m u l a t i o nr e s u l t s s h o w e dt h a t t h eK E C A-C S Km e t h o dh
11、 a db e t t e rd i a g n o s t i c r e s u l t s t h a n t h eK P C A,w h i c hv e r i f i e d t h es u p e r i o r i t yo f t h ep r o p o s e dm e t h o d.K e y w o r d s:f a u l td i a g n o s i s;K E C A;R e n y ie n t r o p y;f e a t u r ee x t r a c t i o n;T e n n e s s e e-E a s t m a np r o
12、 c e s s 随着工业生产过程越来越复杂多变,生产过程中对于设备的安全性和可靠性要求也愈加严格12。为了更多地捕捉过程信息,往往安装多样的传感器来获取大量反映过程信息的数据。通过分析正常数据和不同故障运行模式下的数据,实现基于数据驱动的故障诊断35。工业过程数据往往具有维数高、复杂性强等特点,若直接对获取的原始数据进行故障诊断,不仅消耗计算机资源多,而且诊断效果较差,因此,在工业过程数据上,对原始数据首先进行降维处理,去除数据冗余信息、压缩数据维度从而减少存储空间,消除数据噪声进而提高分类器的分类准确度。主成分分析(p r i n c i p a l c o m p o n e n t a
13、 n a l y s i s,P C A)6作为工业过程数据中最经典的降维方法,能够处理高维、嘈杂和高度相关的数据,因其优异的表现而被广泛应用于故障诊断领域。陈辉等7为了解决在设备故障分类识别中易受输入样本相关性影响的问题,提出P C A-B P神经网络方法对设备进行故障预测。张弛等8提出主成分分析和优化参数支持向量机的智能变电站故障诊断模型,用以解决目前智能变电站故障诊断结构复杂、样本数据量小的问题。但是,当数据分布具有非高斯和非线性特征时,由于使用二阶统计 量 和 线 性 假 设,P C A此 时 表 现 不 佳。核 主 成 分 分 析(k e r n e lp r i n c i p a
14、 lc o m p o n e n ta n a l y s i s,K P C A)91 1在一定程度拓宽了P C A的应用范畴,利用非线性映射将输入数据映射到高维特征空间,在特征空间执行P C A。李梦瑶等1 2用K P C A降低数据维度、剔除冗余信息,从而实现齿轮箱的故障诊断。武文栋等1 3提出K P C A结合麻雀搜索算法优化核极限学习机的方法,用以提高光伏阵列故障诊断的精度。然而,在实际工业过程中,数据通常同时存在着高斯分布和非高斯分布特性,而K P C A在选取主成分的过程中只使用过程变量的方差信息,因此缺少处理非高斯数据的能力,对一些复杂的系统故障处理效果也就不理想。2 0 1
15、 0年,J e n s s e n1 4提出一种新的降维方法核熵成分分析方法(k e r n e le n t r o p yc o m p o n e n ta n a l y s i s,K E C A)。对比K P C A只考虑方差信息只能提取数据的高斯特征。K E C A1 51 7以信息熵为信息衡量的指标,使用高阶统计量最大程度保留原始数据的熵值,同时,其能够捕捉到数据内部的结构信息。如今,K E C A在干旱监测、柴油机故障识别、风电功率预测等领域被广泛应用1 82 0。但目前未查到该方法在化工工业过程多类型故障诊断领域的应用。针对传统算法在多类型故障诊断率较低的问题,本文提出一种
16、K E C A-C S K的故障诊断方法。K E C A进行多种数据分析时,不同类别的数据样本往往互相垂直,而同一类别的数据样本往往共线,基于此特点设计一种基于余弦相似度的K均值聚类器,建立诊断模型,从而对未知类型的故障数据进行判别。本文对田纳西 伊斯曼化工过程(T e n n e s s e e-E a s t m a n,T E)进行模拟实验,验证K E C A-C S K均值方法在故障诊断领域的有效性。1 故障诊断方法1.1 核熵成分分析方法定义数据集D=x1,x1,xn 的概率密度函数p(x),其R e n y i熵H(p)表示为H(p)=-l gp2(x)d()x。(1)由式(1)可
17、以看出,R e n y i熵估计取决于数据集的概率密度函数,不需要对数据的分布进行限定,算法的适用性更强。因为对数函数本身具有单调性,因此只需考虑V(p)=p2(x)dx。(2)为了估计V(p),引入P a r z e n窗函数p(x),表示为p(x)=1nxtDk(x,xt)。(3)式中:n为样本数;k(x,xt)是M e r c e r核函数,为核参数。V(p)用样本均值近似估计V(p),表示为V(p)=1nxtDp(xt)=1nxtD1nxt DK(xt,xt)=1n2ITK I。(4)式中:K为nn的核矩阵;I为n1的单位向量。核矩阵包含了二次R e n y i熵估计值所需的所有元素。
18、对核矩阵进行特征分解,K=E ET。(5)893沈阳大学学报(自然科学版)第3 5卷式中:=d i a g(1,2,n)表示特征值矩阵;E=(e1,e2,en)表示特征向量矩阵。将式(5)代入式(4),得到V(p)=1n2ni=1ieTi()I2=1n2ni=1i。(6)由式(6)可得,R e n y i熵可以表示为n个分量的累积,各个分量都同时包含特征值与特征向量。将输入数据集D=x1,x2,xn,通过非线性映射到核特征空间定义为xi(xi)(i=1,2,n),该特征空间的数据可表示为=(x1),(x2),(xn)。由于K E C A可以被看作最大限度地保留R e n y i熵估计的主轴在包
19、含原始数据最多信息的情况下构造成的子空间,即将数据映射到由k个K P C A主轴张成的子空间Uk上,对i值从大到小排序,选取前k个特征值和特征向量,转换后的数据表示为Fe c a=Uk=12kETkm i n1,e1,n,enV(p)-Vk(p)。(7)式中:Vk(p)是选取前k个特征向量估计的R e n y i熵;Fe c a=(f1,f2,fk)表示得分矩阵。在K P C A中,取前l个特征值和特征向量,转换后的数据表示为Fp c a=121ETl。对于新的样本xn e w在Uk上的投影可表示为Fkn e w=Uk(xn e w)=-12kETkK(x,xn e w)。(8)1.2 C S
20、 K方法K均值算法由于其原理简单、易于理解、容易实现以及理论可靠等优点而被广泛应用于不同领域。由于T E数据经K E C A特征提取后不同类的数据分布在不同的角度方向上,因此本文使用样本到各个质心的夹角余弦值来衡量数据样本之间的相似性,即余弦值越大,表明数据与该类别的数据样本相似度越高。假设两个包含m维特征的向量,表示为=(a1,a2,am),b=(b1,b2,bm),则夹角余弦值可表示为c o s=b b。(9)当,b方向一致时,数据之间夹角越小,夹角余弦值就越接近于1,数据相似度也就越高;同理,当两者之间夹角越大,夹角余弦值就越小,数据相似度也就越低。基于C S K的方法步骤如下:1)初始
21、质心的确定。选取余弦相似度最低的数据样本作为前2个初始质心,然后再选择与前2个初始质心余弦相似度最低的数据样本作为第3个初始质心,以此类推,直至确定C个初始质心;2)将数据样本划分到与C个初始质心余弦相似度最高的类别中;3)更新每个数据类别中的类质心;4)重复步骤(2)(3),当质心位置变化小于给定的阈值,循环结束,保留各类别中心。C S K均值方法运用于故障诊断领域,首先是将混合的不同故障类别数据进行聚类,聚类结束以后,保留不同故障类别的聚类中心,构建诊断模型。对新获得的未知类别的测试数据进行故障诊断时,确定此故障数据样本与哪一类别的聚类中心余弦值最大,那么该样本的故障类别属性就与那一类故障
22、样本的类别属性一致。1.3 K E C A中核参数的选取本文K E C A中核函数选取高斯核函数,表达式为k(x,xt)=e x p(-0.5x-xt2/2)。(1 0)式中,为待优化的核参数。在聚类分析中,尽可能使得同类数据之间相互靠近,不同类数据之间相互远离。因此,核参数选取规则定义如下:1)类内离散度。Sw=1Ci=1n2it,tCic o s(Fe c a(xt),Fe c a(xt)。(1 1)993第5期 李 榕等:基于核熵成分分析的工业过程故障诊断 2)类间离散度。Sb=1n2-Ci=1n2itCi,t Cj,ijc o s(Fe c a(xt),Fe c a(xt),i,j=1
23、,C。(1 2)式中,C为数据样本类别个数。使用基于角结构的类内与类间离散度的差作为选取的准则函数,即:J=m a x(Sw-Sb)。(1 3)根据S h i等2 1提出的参数值选取方法,将原始空间样本欧氏距离中值的1 0%2 0%作为参数选取范围,然后利用所定义的准则函数选取合适的核参数。2 基于K E C A-C S K均值故障诊断基于K E C A-C S K均值故障诊断方法分为离线建模和在线诊断2部分,K E C A-C S K均值方法的诊断流程图如图1所示。图1 基于K E C A-C S K均值故障诊断流程F i g.1 F a u l t d i a g n o s i s f
24、l o w c h a r t b a s e do nK E C A-C S K2.1 离线建模1)获取训练数据共m个变量n个样本X=x1,x2,xnRmn,并进行标准化处理;2)构建K E C A模型,根据式(7)计算得分矩阵Fe c a;3)计算Fe c a向量之间的余弦值,确定C个初始聚类中心;4)根据余弦相似度大小,将数据划分到相对应的类群中;5)更新C个类群的聚类中心;6)重复步骤4)5),各类群中心变化小于阈值,则停止,获得聚类中心。2.2 在线诊断1)测试数据xn e w并进行标准化处理;2)测试数据向K E C A模型进行投影,通过式(8)计算得分矩阵Fkn e w;3)计算
25、Fkn e w与建模时各类群聚类中心的余弦值,将其划为余弦值最大的类群。3 T E仿真实验T E过程是由美国E a s t m a n化学公司的D o w n s和V o g e l共同开发的T EB e n c h m a r k仿真模拟平台,由该平台产生T E数据,近年来被广泛应用于工业生产故障检测与诊断2 22 6。T E工业流程主要包括反应器、冷凝器、循环压缩机、气液分离器和汽提塔等5个操作单元,整个过程中共涉及8种物料成分,分别为主要参加反应的气体进料U、C、D、E;惰性不可溶进料B;反应副产品F以及反应液态主产物G和H。该平台总共预设了2 1种故障,其中,I D V 1 I D V
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 成分 分析 工业 过程 故障诊断
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。