基于密度聚类的复杂装备健康监测方法.pdf
《基于密度聚类的复杂装备健康监测方法.pdf》由会员分享,可在线阅读,更多相关《基于密度聚类的复杂装备健康监测方法.pdf(9页珍藏版)》请在咨信网上搜索。
1、()指挥控制与仿真 引用格式:余彦,蔡霖,张冲,等基于密度聚类的复杂装备健康监测方法指挥控制与仿真,():,():基于密度聚类的复杂装备健康监测方法余 彦,蔡 霖,张 冲,冀弘帅(北京机械设备研究所,北京)摘 要:针对复杂装备历史数据往往存在非球形的特征,提出了一种基于密度聚类的复杂装备健康监测模型。从历史数据中估计各个样本的局部密度和类间距离,并综合考虑两者的统计特性以确定数据的聚类中心,对于新采集的复杂装备健康状态监测数据,如果它与聚类中心密度可达,就认为该复杂装备处于健康状态,否则就处于非健康状态。通过数值仿真技术分析了一个实际的复杂装备数据集,以及利用散点图、盒图和平行坐标系等可视化技
2、术来验证计算结果的可靠性,仿真结果表明提出的方法能够有效监测复杂装备的健康状态。关键词:密度聚类;健康监测;局部密度;类间距离;平行坐标系;密度可达中图分类号:文献标志码:,(,):,:;收稿日期:修回日期:作者简介:余彦(),男,博士研究生,工程师,研究方向为动力学与控制。蔡 霖(),男,研究员。健康监测方法用于计算当前装备处于其运行过程中的哪一种状态,例如健康状态或非健康状态。当装备处于非健康状态时,寻找导致其产生异常的具体原因,以及评价当前状态偏离正常水平的大小。健康监测方法对装备的有效运转发挥着重要作用,在很大程度上影响装备的性能表现,因此正受到学术界和工业界越来越广泛的关注。健康监测
3、的研究现状健康监测方法分为基于机理的方法和基于数据的方法两大类,其中基于机理的方法通过物理定律建立机理模型,如果各个物理变量均符合该模型,就认为系统处于健康状态,否则就处于非健康状态。张建等综合利用灰靶决策理论和熵理论来监测航空发动机的健康状态。陈雪峰等通过模态振型对复合材料构件进行健康监测。曾燕军等建立了车体结构的数学模型。高鑫磊基于起动系统环境参数集合监控起动系统的工作状态。马硕使用液体火箭动力系统故障检测与诊断模型估计火箭动力系统的运行状态。实际问题中系统包含的物理变量之间的关系非常复杂,机理模型通常难以建立,从而导致基于机理的方法使用受限。随着数据处理技术的发展,越来越多的研究人员采用
4、基于数据的方法来监测系统的健康状态。聚类算法在数据处理技术中占有重要地位,它利用相似性对数据进行分类,使得同类数据的相似性尽可能大,而不同类数据的相似性尽可能小。离群点是数据集中与大多数数据偏离较远的对象,它们能够表征数据集的某些特点。例如对于复杂装备而言,它绝大部分时刻都处于健康状态,对应的正常数据被聚成了若干类,当新采集的数据偏离这些正常数据,也就是出现离群点时,就认为该装备进入了非健康状态,常见的 和 等聚类算法稍加修改就可用于 余 彦,等:基于密度聚类的复杂装备健康监测方法第 卷离群点的识别。李洁珊等通过 两层聚类方法分析变压器集群健康状态。侯美慧等提出了一种威布尔分布与 模糊聚类相结
5、合的健康状态识别方法。季业等使用聚类分析计算动量轮健康性最大阈值并以此监测动量轮的健康状态。于凯等通过参数自适应 聚类方法判断旋转设备的健康状态。侯学理等使用加权相似聚类算法进行直升机的异常状态监测与健康管理。以上聚类算法要么基于距离对样本进行分类,要么根据密度对样本进行分类。基于距离的聚类算法通常只能处理特定形状的数据,以欧氏距离聚类算法为例,它倾向于将同一类别的样本聚成球形,对于非球形数据,它的性能表现很差。相比之下,基于密度的聚类算法可以处理任意形状的数据,不过它们需要预先设定超参数,例如 算法需要事先确定邻域阈值和最小邻居个数两个超参数。聚类结果对超参数特别敏感,如果超参数设置不合理的
6、话会产生很差的聚类结果。针对上述问题,本文提出了一种基于密度聚类的复杂装备健康监测方法,首先从历史数据中估计截断阈值,然后通过截断阈值计算各个样本的局部密度和类间距离,接下来利用局部密度和类间距离确定数据的聚类中心,最后通过数据与聚类中心是否密度可达来进行聚类。当数据聚成若干簇,也就是所有数据均与聚类中心密度可达时,就认为该复杂装备处于健康状态,而当出现离群点时,就认为该复杂装备处于非健康状态。健康监测问题描述将由复杂装备构成的系统定义为,它包含的物理变量的个数为,并且给定的历史数据集被表示为 ()其中,()(),(),(),为采样时刻,为样本总数。对应的指标集为 ,它是由 中所有样本的采样时
7、刻构成的集合。通过对已有的历史数据集进行分析,发现当系统处于健康状态时,历史数据集中的各个样本均聚成若干簇,而当系统处于非健康状态时,历史数据集中出现了离群点。因此,系统的健康监测问题就可以转化为聚类问题,当聚类结果的输出为若干簇时,就认为系统处于健康状态;当聚类结果的输出包含离群点时,就判定系统处于非健康状态。基于距离的聚类算法(例如 算法)往往对球形数据表现良好,球形数据是指数据可以被划分成若干簇,并且每一簇数据的外包络都近似为圆 椭圆(维数据)、球 椭球(维数据)、超球 超椭球(高于 维的数据)。相比之下,其他的数据为非球形数据。在图)中,数据可以被划分为左下角和右上角两簇,并且这两簇数
8、据都可以被椭圆包络住,因此这些数据是球形数据。如图)所示,这些球形数据可以被 算法准确聚类。实际问题对应的数据的形状多种多样,例如图)所示的螺旋形数据,算法对该数据的聚类结果如图)所示,可以发现聚类结果不好。基于密度的聚类算法(例如 算法)虽然可以处理任意形状的数据,但它的聚类结果对超参数很敏感。图)和图)是 算法在不同超参数(领域阈值 和最小邻居个数)情况下的输出,可以发现当超参数的值设定不合理时,数据会被错误地聚类,例如图)将数据聚成 簇。超参数的调整过程非常繁琐,需要不断地试错。下文详细阐述了一种新的基于密度的聚类算法,它可以处理任意形状的数据,并且不需要调整超参数。密度聚类算法这一节首
9、先介绍如何从给定的数据集中计算各个样本的局部密度和类间距离,然后描述利用局部密度和类间距离构建决策图并进一步确定聚类中心的详细步骤,最后给出利用各个聚类中心来进行健康监测的方法。局部密度和类间距离的计算对于样本()和(),它们之间的距离被定义为()()()样本()的局部密度 的计算公式为()()其中函数为示性函数,它具有如下性质(),参数 为截断阈值,它需要事先给定。由公式()和()可知,的物理意义是 中除了()自身,与()之间的距离小于 的样本的个数。等提出了一个经验法则用于确定合适的 取值:选取一个,使得每个样本的平均邻居个数大约等于样本总数的 。在这条经验法则里,邻居指的是如果两个样本之
10、间的距离不超过,那么这两个样本互为邻居。基于 经验法则来确定 的详细步骤阐述如下。对于 ()中的每个样本(),它与其他 个样本()都能通过公式()计算得到一个距第 期指挥控制与仿真 图 球形和非球形数据的聚类 离,因此一共有()个距离。由于样本()与()之间的距离和样本()与()之间的距离是一样的,即 ,这()个距离中有一半是重复的。将距离,(一共有()个)按照从小到大进行排序,将排序后的序列记为 ()如果令 等于序列()中第 个元素的值,即,()那么在序列()中,满足“距离不超过”的概率为,因此在 ()中,每个样本的平均邻居个数为,根据 经验法则可得()通过公式()可以得到的取值范围为 ()
11、综上所述,首先通过公式()确定距离,的升序序列,然后根据不等式()计算 的范围并将区间中点作为最终的取值,最后利用公式()即可确定截断阈值。接下来介绍类间距离的计算。设 为局部密度集 的一个降序排列下标序,即它满足 则样本()的类间距离 的计算公式为,()类间距离 的物理意义为在所有局部密度大于 的样本中,与()距离最小的那个样本与()之间的距离。需要注意的是,当()具有最大局部密度时,表示 中与()距离最大的样本与()之间的距离。为了更加形象地展示局部密度 和类间距离的计算原理,图 展示了一个二维的仿真案例。以样本()为例,在图所示的案例中,蓝色的圆点代表样本(),将截断阈值 的值设为 ,以
12、样本()为圆心,以 为半径画圆,得到左边青色的虚线圆,圆内样本的个数即为()的局部密度,显然只有()位于左边青色的虚线圆内,样本()的局部密度为,同理可得其他样本的局部密度。由图 可知,样本()和()的局部密度分别为 和,它们的局部密度均大于样本()的局部密度,又由于样本()到()之间的距离为 ,小于样本()到()之间的距离,样本()的类间距离为 。聚类中心的确定上一小节介绍了数据集 中任意一个样本()的局部密度 和类间距离 的计算方法,本小节阐述如何利用和来确定的聚类中心。以为横轴,为纵轴,将各个样本对应的局部坐标和类间距离可视化在平面直角坐标系中,得到的二维图形被定义为聚 余 彦,等:基于
13、密度聚类的复杂装备健康监测方法第 卷类中心决策图,一个具体包含 个样本的聚类中心决策图如图 所示。在图)和图)中,同一颜色的点表示同一个样本(),只不过在图)中,()对应的横纵坐标分别是()和(),而在图)中,()对应的横纵坐标分别是 和。在图)中,红色和绿色的圆点从其他颜色的圆点中脱颖而出,它们和 取值都比较大。基于图)可以发现,这 个样本可以分为两类,红色的圆点可以视为左下角那个类的中心,而绿色的圆点可以视为右上角那个类的中心。综上所述,通过定性分析可知,聚类中心具有较大的局部密度和类间距离。图 局部密度和类间距离计算示意图 图 散点图与聚类中心决策图 图 定性分析了聚类中心的判断方法,接
14、下来定量计算聚类中心的确定标准。由于聚类中心具有较大的局部密度和类间距离,定义()需要注意的是,和 的取值处于不同的数量级,为了消除该影响,在利用公式()计算 时,已经提前对 和做了归一化处理,也就是说,将和的取值归一化到区间,。显然,的值越大,它对应的样本越有可能是聚类中心。设 为由构成的集合 的一个降序排列下标序,即它满足 ()将 的降序排列集合 中的元素可视化在平面直角坐标系中,一个具体案例如图 所示。在图 中,蓝色的曲线表示 随 的变化,由于 的值越大,它对应的样本越有可能是聚类中心,通过图 可以发现,聚类中心对应的值变化剧烈,而非聚类中心对应的 值比较平滑,并且从聚类中心过渡到非聚类
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 密度 复杂 装备 健康 监测 方法
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。