基于XGBoost-LSTM的水轮机轴瓦温度预测.pdf
《基于XGBoost-LSTM的水轮机轴瓦温度预测.pdf》由会员分享,可在线阅读,更多相关《基于XGBoost-LSTM的水轮机轴瓦温度预测.pdf(7页珍藏版)》请在咨信网上搜索。
1、2023年10 月引用格式:谈群,振亚,秦拯,等.基于XCBoost-LSTM的水轮机轴瓦温度预测J.水利水电快报,2 0 2 3,44(10):6 5-7 0,7 6.水利水电快报EWRHI第44卷第10 期基于 XCBoost-LSTM 的水轮机轴瓦温度预测谈群1,2,部振亚,秦拯1,苗洪雷?(1.湖南大学信息科学与工程学院,湖南长沙410 0 8 2;2.华自科技股份有限公司,湖南长沙410 2 0 5)摘要:为保障水轮机在工作状态下的安全运行,有必要对轴瓦温度进行预测研究,提出了一种基于XG-Boost-LSTM的轴瓦温度预测模型,利用XGBoost进行特征选择,挑选出对轴瓦温度有影响
2、的重要特征;利用LSTM进行时间序列分析,挖掘出特征的未来发展趋势,得到更加准确的预测结果。结果表明:特征选择后模型精度得到了一定程度提升,LSTM模型能够较好地预测出轴瓦温度的变化趋势,预测值与真实值的最大误差小于1,研究成果可为水轮机故障预测与健康管理系统的开发提供理论和技术支持。关键词:轴瓦温度;特征工程;XGBoost;时间序列;长短期记忆(LSTM)中图法分类号:TK730.322文章编号:10 0 6-0 0 8 1(2 0 2 3)10-0 0 6 5-0 6文献标志码:AD0I:10.15974/ki.slsdkb.2023.10.011的人工神经网络BP算法对水轮机轴瓦温度进
3、行建0 引 言模和预测,实现了对模拟瓦温变化趋势的准确预测。中国水电行业发展迅速,水电机组装机容量持唐诗等 采用支持向量机模型对轴瓦温度进行了续提升,设备的维修和保养也越来越重要。在水力预测,结果显示根据仿真分析结果得出的预测值能发电的机组中,稳定轴瓦温度对水轮机在工作状态够较好地跟踪实际值。下的安全运行起着重要的作用1-3。轴瓦温度过高总结现有文献,水轮机轴瓦温度升高机理的研会造成烧瓦事故,迫使机组停机甚至发生重大安全究相对充分,但对轴瓦温度进行预测和预警的研究事故。监控轴瓦温度、及时发现轴瓦温度异常、避免相对较少,且存在以下两点不足:在建模时,普遍进一步的损失是水电站工作人员的重要工作。只
4、选取了影响轴瓦温度的直接因素,忽略了工况数国内外学者对水轮机轴瓦温度的研究主要集中据如有功功率、水头等因素。水轮机在运行时,组件于研究水轮机轴瓦温度升高的机理,识别轴瓦温度之间的影响十分密切,不同的水轮机机组的运行环升高的原因,进而提出相应的日常巡检和维修处理境、设备的健康状况不尽相同,轴瓦温度的影响因素建议;基于理论和数学模型,进行轴瓦温度预测和故障预测与健康管理(Prognostic and Health Manage-ment)系统开发。毋生俊等2 等根据多年运行水电站的经验,对水轮机轴瓦温度升高的原因进行了详细分析,对不同原因提出了相应的预防和维修措施建议。Gunasekara41对轴
5、瓦温度的动态变化进行建模和模拟,发现轴瓦温度取决于多个变量,如环境空气温度、冷却水和冷却水流量、初始轴承温度、运行持续时间和电力负荷,很难利用常规的建模方法对这种传热系统进行建模。唐勇等5 根据温度系统非线性、大滞后、多变量、强耦合等特点,提出了改进收稿日期:2 0 2 3-0 3-0 8基金项目:长沙市科技计划项目(kh2204007)作者简介:谈,群,男,博士,主要从事大数据、人工智能、设备故障诊断与预测等方面研究工作。E-mail:通信作者:部振亚,男,硕士,主要从事大数据分析、机器学习与建模工作。E-mail:65.也应包括各自的实际条件。在预测方法上,虽然考虑了变量之间的非线性因素,
6、但是普遍将历史数据进行统一输人,未充分考虑温度序列随时间的变化趋势。水轮机的测点监测数据是由传感器收集到的按照时间顺序排列的一系列观测数值,各个参数的时间效应明显,如温度是随时间递增或递减而并非离散的,水轮机正常工作时,某一时刻的温度与之前的温度紧密相关。对此,本文首先对水轮机轴瓦温度的影响因素进行分析,识别出轴瓦温度的直接因素和工况2023年10 月因素,然后采用特征工程算法筛选出对轴瓦温度真正有影响的特征,再利用时间序列分析的方法进行建模,得出更为精确的轴瓦温度预测方法,旨在考虑不同水轮机各自的实际情况,搭建出具有普适性的轴瓦温度预测方法,更准确地预测出轴瓦温度,为温度告警等相关系统提供相
7、应的技术支撑。1水轮机轴瓦温度影响因素分析水轮机工作时,轴瓦表面与轴颈之间由于机械摩擦而产生热量,润滑油起到减少摩擦作用,又可以把少部分热量及时通过润滑油的循环带出,热的润滑油经过冷却水变成冷油供给轴瓦再次使用,如此循环往复构成冷却系统。因此,一般来说,在机组正常工作的情况下,轴瓦温度不会发生太大的变化。基于以上工作机理以及可量化的条件,本文梳理出以下几个轴瓦温度升高的原因。(1)机组转速。水轮机机组的转子通过旋转使得轴瓦与轴颈进行摩擦,产生热能。理论上,机组转速越快,短时间内产生的热能也越多。在实际的工作中,工作人员发现当机组转速较低时,油膜未能充分形成,轴瓦温度反而更高甚至造成烧瓦。因此,
8、部分水电站明确禁止水轮机长时间在低转速环境下工作。(2)油膜厚度。机组运行时,轴瓦与轴颈之间由于机械运动产生摩擦阻力,进而使轴瓦温度升高。润滑油作为降温和润滑的媒介,与轴瓦、轴颈充分接触并形成一定厚度的油膜,减少轴瓦与轴颈的摩擦阻力,因此,可以通过油膜厚度来反映轴承之间的润滑状况及其瓦面温度的变化。(3)冷却水压力。冷却水压力过低时会降低冷却器的过流量,影响冷却器的正常工作,引起轴瓦温度升高。(4)环境温度。在水轮机正常工作时,轴瓦与外界环境接触,一方面轴瓦温度会随着环境温度呈现季节性和昼夜温差变化;另一方面,外界环境会与轴瓦、冷却水等设备产生热量交换,对轴瓦温度起到一定的调节作用。(5)工况
9、因素。水流流过水轮机时,通过主轴带动发电机旋转将机械能转换成电能。在效率不变的情况下,发电机产生的功率越大,需要的机械能越多,轴瓦做功也越多。水头、流量等也会对轴瓦温度产生相应的影响。除以上因素外,润滑油的质量、主轴摆度、机组66.水利水电快报EWRHI振动、冷却水系统故障等因素也会对轴瓦温度产生影响,查找原因时必须全面考虑,但这些因素难以进行量化,无法在数学模型中准确表述,因此在建模时暂不考虑。2特征工程2.1特征工程重要性由众多监测点对水轮机工作数据进行收集,各个信号之间会相互叠加,彼此影响,甚至会存在余信息。单个监测点无法真实反映出设备的运行状态和故障信息,需要结合多个监测点的信号数据综
10、合考虑。如何从众多的监测数据中找到有效的特征,对于模型的搭建、预测的准确性和科学性十分重要。特征工程是机器学习中最重要的一部分,是指把原始数据转变为模型训练数据的过程,目的是获取更好的训练数据特征,使机器学习模型能够逼近数据的上限7 。特征工程一般可以分为特征构建、特征选择和特征提取。特征构建需要一定的构建经验,通过不断训练累积经验,学习如何构建。特征提取和特征选择较为相似,区别在于特征提取更加强调通过一定的特征转换的方式获取模型数据输入集。特征选择是从特征集合中挑选一组具有明显物理或统计意义的特征子集,如水轮机轴瓦温度预测的过程中也使用特征选择,模型一般挑选环境温度、油膜厚度等特征作为模型训
11、练的数据集。本文将重点放在特征选择上,目的是通过特征选择从众多的监测点数据中挑选出对水轮机轴瓦温度有影响的因素。现有文献在预测水轮机轴瓦温度的建模中,普遍只选择了环境温度、油膜厚度、机组转速等特征,未考虑其他因素。采用统一的特征进行建模不能适应所有水电站的情况。不同水电站的基础建设不同,尤其是小水电站,部分特征无法收集,如油膜厚度为流体,数据难以测量,小型水电站此类数据普遍缺失。此外,不同的水轮机、同一水轮机的不同工作环境会导致水轮机各个信号之间的影响不同,在实际工作中,工况的相关特征对轴瓦温度的影响程度应当视水轮机的实际情况来判断。因此,对轴瓦温度进行建模时,应当充分考虑水轮机的实际情况,从
12、众多的特征中选择合适的特征子集。2.2基于XGBoost的特征选择原理介绍XGBoost是对梯度提升决策树(GBDT)的改进,第44卷第10 期谈群等基于XGBoost-LSTM的水轮机轴瓦温度预测能够多线程实现回归树的并行构建,将计算速度和效率发挥到极致8。GBDT只利用了一阶导数的信息,XGboost对损失函数做了二阶泰勒展开,计算精度更高,而且XGboost在目标函数中加入了正则项,有效地防止了过拟合,相较于GBDT算法更具优势。一些学者在特征选择的实证分析中,发现XGBoost在众多模型中表现出最优性能7.9。XGBoost 算法具体可表示为(1)=/(a)=30+/(x)(2)=f(
13、)+f(a)=50+J()(3)y=Z5.(at)=5-)+f(a)(4)n=1式中:y表示最终的回归结果;N表示决策单元的数量;f()表示第k个样本在第N棵树中的预测值,再累加上前面N-1次的预测值(N-1)即为最终的预测结果。可以看出,XGBoost先迭代第1棵树,再迭代第2 棵,直到迭代完N棵树,每棵树都是通过学习前N-1棵树的残差来最终构成由N棵树线性组合而成的模型。XGBoost算法进行特征选择的原理如下:在单个决策树中,利用每个属性分割点改进性能度量的量来计算属性重要性,由节点进行加权和记录次数。一个属性对分割点改进性能度量越大,权值越大,属性越重要。最后将属性在所有提升树中的结果
14、进行加权求和并平均,得到重要性得分Fscore。Fs c o r e可以理解为特征在决策树里出现的次数,一般来说,如果一个特征在所有树中作为划分属性的次数越多,那么该特征就越重要。Fscore计算如下所示,式中M是所求特征分类到节点的集合。Fscore=I M I3基于LSTM的轴瓦温度时间序列预测水轮机的轴瓦温度、环境温度等具有明显的随时间变化的趋势,并且监测数据通常按照时间顺序排列。在进行轴瓦温度的预测研究中,有必要对其进行时间序列分析,挖掘出特征的未来发展趋势,得到更加准确的预测结果。时间序列分析的模型较多,传统的模型如自回归模型、滑动平均模型、自回归滑动平均模型等,都属于线性回归模型。
15、实际的时间序列数据较为复杂,非线性成分较多,以上模型在复杂的时间序列分析中具有很大的局限性。随着深度学习技术的发展,一些深度学习模型逐渐被应用到时序数据的研究中,其中循环神经网络(Recur-rentNeuralNetwork,RNN)模型应用最为广泛。RNN将时序的概念引入到网络结构设计中,使其在时序数据分析中表现出更强的适应性。但RNN模型存在以下两个问题:由于梯度消失和梯度爆炸的问题,RNN不能处理延迟过长的时间序列;训练RNN模型需要预先确定延迟窗=0口长度,然而实际应用中很难自动地获取这一参数的最优值10 。长短期记忆(LongShortT e r mMemory,LSTM)模型弥补
16、了RNN的梯度消失和梯度爆炸、长期记忆能力不足等问题,使得循环神经网络能够真正有效地利用长距离的时序信息。在不同领域内,LSTM 在时间序列的处理上比传统的时间序列分析方法表现出了更优秀的精度12-13。LSTM的内部模块如图1所示,和tanh分别代表sigmoid和双曲正切激活函数,其前向计算方法可以表示如下。i,=o(Wix,+Whht-1+Wec,-I+b,)f,=o(Wrt,+Wwht-1+Wgct-1+by)Cc,=f.ct-1+itanh(Wex,+Wheh-1+b.)(8)O,=o(Wox,+Wh.ht-I+W.c,+b。)(9)h,=o,tanh(c,)(10)式中:i,f,c
17、,o分别为输人门、遗忘门、细胞状态、输出门。W代表对应的权重系数;b为偏置项。通过前向计算每个单元的输出值和最后的输出值,将最后的输出值与标签计算出误差,根据反向梯度计算完成每一层每一个单元的参数更新,从而完成训练。(5)图1LSTM模型的内部模块Fig.1 Internal module of the LSTM model4实验验证本文提出了一种基于XGBoost特征工程和LSTM时间序列分析(XGBoostLST M)来预测水轮机轴瓦温度的方法,主要流程如图2 所示,本节结合实际数据对此方法展开实验验证。67.(6)(7)CanhaphX2023年10 月特征收集时间环境温度冷却水压力数据
18、清洗特征选择XGBoost进行特征选择目标参量特征参量1归一化处理时序数据构建LSTM训练集模型预测LSTM模型+反归一化预测输出图2 模型预测流程Fig.2Model prediction flow chart4.1楼数据预处理和参数确定本文实验数据来源于海南某水电站2 0 2 2 年11月至2 0 2 3年1月的历史数据,运行数据真实可靠,来源具有合法性。该电站装有3台2.5MW混流式机组。虽然影响轴瓦温度的特征众多,但不同的水电站信息化、智能化建设水平不同,特别是小水电站不能收集到所有的特征。根据该电站的实际情况,收集到的变量包括轴瓦温度、环境温度、有功功率、机组转速、励磁电压与冷却水压
19、力。本文对该水电站的运行数据按照5min为一次间隔进行收集,并对停机数据、异常数据、缺失值采用直接删除的方法。数据清洗后,共有2 8 34条原始数据。为了加快模型的收敛速度,本文采用Min-Max标准化方法对数据进行标准化,见公式(11)。(11)Xmax-Xmin式中:x*为标准化后的温度数值;为当前温度;max与xmin分别为模型测练温度值中的最大值与最小值。划分数据集时,将预处理后的数据按照8:2 的比例划分训练集与测试集。根据现场的实际情况和模型的调优结果,本文将LSTM模型的跳跃步长设置为12,并进行单步预测,即用前12 条记录预测下68.水利水电快报EWRHI一时刻的轴瓦温度,依次
20、递进;学习率设置为轴瓦温度机组转速油膜厚度特征参量n测试集x-min第44卷第10 期0.001,并加人早停法(Early Stopping)来防止模型的过拟合。4.2评估指标为评价模型对轴瓦温度的预测结果,本文选取了以下3个评估指标:(1)均方误差为MSE=2(y:-y.)ni=1(2)平均绝对误差为1MAE=n台(3)最大绝对误差为MAXE=max(l y-y;l,i 1,nI(14)式中:n为选取的样本数量,y为预测值,y;为实际值。4.3结果与分析特征过多时会增加算法复杂度,增加模型训练和预测时间,因此在模型训练之前,有必要进行特征选择。本文选取XCBoost进行特征选择,使用Py-t
21、hon3.7环境下的XGBoost工具包进行特征评分。XGBoost有两种评分方式:在模型训练完成之后,调用feature_importances_参数查看每一个特征对模型的重要程度,即哪些特征变量在模型中发挥的作用更大。数值越大,重要性也越高;调用get_score()方法获得特征重要性得分,一般使用total_gain参数,表示在所有树中该特征在每次分裂节点时带来的总增益。图3 4是使用XGBoost计算得到各个特征的重要性和重要性得分,可以看出,变量中对轴瓦温度影响程度最大的分别是冷却水压力、环境温度和有功功率,表明该水轮机的冷却系统和实际工况对轴瓦温度起着重要作用。机组转速的影响程度最
22、小。这是因为,水电站的机组为额定频率,水轮机工作时,机组通过调速器等设备使得机组转速维持在恒定值,以保障机组的安全性能。对于数学模型来说,机组转速接近为一个常量,对模型的影响较小。因此,虽然理论上机组转速对轴瓦温度有着重要影响,但结合水电站正常工作的工况,机组转速并不能作为预测轴瓦温度的特征,这也验证了选取特征时考虑水轮机实际情况的重要性。结合以上分析,进行特征选择后筛选出的变量为冷却水压力、环境温度和有功功率,这些特征的重要性累计和为0.8 7。(12)(13)谈群等基于XGBoost-LSTM的水轮机轴瓦温度预测0.550.500.45F0.400.350.300.200.15F0.10F
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 XGBoost LSTM 水轮机 轴瓦 温度 预测
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。