卡尔曼滤波能耗预测模型及其应用.pdf
《卡尔曼滤波能耗预测模型及其应用.pdf》由会员分享,可在线阅读,更多相关《卡尔曼滤波能耗预测模型及其应用.pdf(7页珍藏版)》请在咨信网上搜索。
1、电 力 系 统 及 其 自 动 化 学 报Proceedings of the CSU-EPSA第 35 卷 第 7 期2023 年 7 月Vol.35 No.7Jul.2023卡尔曼滤波能耗预测模型及其应用刘亮,陈仙亮(南京大全电气研究院有限公司,南京 211100)摘要:为满足工业能耗管控对能耗测量数据的自适应异常检测和缺失替代需求,提出一种基于卡尔曼滤波算法的能耗预测模型。结合应用场景特点,描述模型对应的卡尔曼滤波递推方程组的计算变量和模型参数,提出模型参数的获取方法,即采用 K-均值聚类算法对原始的功率和能耗历史样本进行聚类,使用格拉布斯准则剔除聚类样本中的异常数据,基于剩余聚类样本实
2、施无偏估计得到模型参数。实验数据表明,卡尔曼滤波能耗预测模型适用于工业能耗管控的相关需求。关键词:能耗预测;自适应异常检测;缺失替代;卡尔曼滤波;K-均值聚类;格拉布斯准则中图分类号:TM933文献标志码:A文章编号:1003-8930(2023)07-0102-07DOI:10.19635/ki.csu-epsa.001040Kalman Filtering Energy Consumption Prediction Model and Its ApplicationLIU Liang,CHEN Xianliang(Nanjing Daqo Electrical Institute Co.,
3、Ltd,Nanjing 211100,China)Abstract:An energy consumption prediction model based on the Kalman filtering algorithm is proposed to meet the requirements of adaptive anomaly detection and missing substitution for the energy consumption measurement data in industrial energy consumption control.Combined w
4、ith the features of application scenarios,the calculation variables andmodel parameters of the Kalman filtering recursive equations corresponding to the model are described,and a methodto obtain the model parameters is proposed.The K-means clustering algorithm is used to cluster the original power a
5、ndenergy consumption history samples,the abnormal data in clustered samples are removed by the Grubbs criterion,andthe model parameters are obtained based on unbiased estimation of the remaining clustered samples.The experimentaldata show that the proposed Kalman filtering energy consumption predict
6、ion model is suitable for meeting the relevantrequirements of industrial energy consumption control.Keywords:energy consumption prediction;adaptive anomaly detection;missing substitution;Kalman filtering;K-means clustering;Grubbs criterion实行能源消费强度和总量双控是推动实现碳达峰、碳中和目标的重要手段。为达成双碳目标,工业企业需要全面准确地掌控能耗数据,发现
7、并改进低能效的生产设备、生产流程和实施需量控制等能耗控制策略,从而减少单位能耗,降低成本增加效益。准确的能耗测量数据是工业企业有效实施能耗管控的基础。受高温、粉尘、潮湿和密闭等不良环境,以及电压波动、电磁干扰等不良工况的影响,当测量设备提供的能耗数据在正常波动之外时,会随时发生数值超出正常范围、数据丢失等问题,可能导致能耗管控系统错误地发出需量报警、负荷投切等管控指令。因此,在工业能耗管控场景中,需要对能耗采集数据进行实时检测,发现异常数据,填补数据缺失,保障能耗管控策略正确执行。传统的能耗数据检测多数使用缺乏自适应能力的固定阈值比较法1,数据填补也大多通过线性内插实施,使数据误差大、实时性低
8、,难以满足工业能耗管控场景的需要。近年来,随着机器学习、深度神经网络等技术的发展,采用预测方法来实施自适应的能耗数据异常检测和自动缺失填补成为研究的方向。文献2提出基于概率预测的电量偏差识别方法,通过电量实测数据与电量概率预测结果之间的差异发现电量数据异常;文献3提出基于预测误差最小化的参数组合优化局部加权回归模型LOWESS(locally weighted regression)自动处理电能量数据缺失等。然而,基于机器学习、深度神经网络的数据预测技术往往需要在线处理大量数据,通常涉及矩阵、求导和多项式等复杂计算及其迭代,收稿日期:2022-03-01;修回日期:2022-06-30网络出版
9、时间:2022-07-12 14:39:26基金项目:江苏省工业和信息产业转型升级专项资金项目(工业互联网标杆工厂项目:大全电气云工业互联网平台)刘亮等:卡尔曼滤波能耗预测模型及其应用刘亮等:卡尔曼滤波能耗预测模型及其应用103第 35 卷在工业能耗实时管控场景中应用的成本较高。本文提出一种基于卡尔曼滤波算法的能耗预测模型,该模型的参数通过离线统计历史样本来确定,预测计算只依赖前一状态的少量数据4,计算规则简单无迭代,能够以低成本满足在工业能耗管控场景中对于能耗测量数据实时进行自适应异常检测和缺失填补的需求。1卡尔曼滤波简介卡尔曼滤波是贝叶斯估计原理的线性最小方差最优准则的典型实现,适用于线性
10、系统5。卡尔曼滤波算法可依靠测量值随着迭代过程不断对估计值进行修正,对数据有很好的跟随性,其描述的系统状态模型和观测模型6可表示为xt=Ext-1+wt(1)yt=Hxt+vt(2)式中:xt为目标在t时刻的系统状态;xt-1为目标在t-1时刻的系统状态;E为状态模型的参数矩阵;wt为t时刻系统过程高斯白噪声,其协方差为Q;yt为目标在t时刻的观测值;H为观测模型的参数矩阵;vt为t时刻观测高斯白噪声,其协方差为R。卡尔曼滤波算法利用前一时刻的系统状态先验预测值、当前时刻的观测值、系统的过程噪声和观测噪声来更新系统状态的优化估计值,其递推方程4可表示为x*t=Ext-1(3)P*t=EPt-1
11、ET+Q(4)kt=P*tHT(HP*tHT+R)-1(5)xt=x*t+kt(yt-Hx*t)(6)Pt=(I-ktH)P*t(7)式中:x*t为t时刻的系统状态预测值;xt-1为t-1时刻的系统状态优化估计值;P*t为x*t对应的系统协方差;Pt-1为xt-1对应的系统协方差;kt为t时刻的系统卡尔曼增益;xt为t时刻的系统状态优化估计值;Pt为xt对应的系统协方差;I为单位矩阵;ET、HT分别为状态模型参数转置矩阵和观测模型参数转置矩阵。2卡尔曼滤波能耗预测模型工业项目中的测量数据以固定周期自动采集,根据W=PT的关系定义,当周期T固定时,工业设备的能耗W与功率P成线性关系。以工业设备的
12、能耗作为研究对象,将其作为系统状态xt;以工业设备的功率测量值作为观测值yt,假设xt和yt叠加了高斯白噪声,那么可以套用卡尔曼滤波模型对工业设备的能耗和功率进行描述。不考虑工业设备工作模式切换的短暂状态,在特定工作模式下运行的工业设备的能耗状态保持稳定,此时卡尔曼滤波模型递推方程组中的矩阵E简化为标量1。由于功率和能耗均为标量数据,根据卡尔曼滤波观测模型定义,将观测矩阵H和所有协方差矩阵简化为标量数据。因此,基于卡尔曼滤波递推方程组在特定工作模式下运行的工业设备的能耗预测模型可表示为x*t=xt-1(8)P*t=Pt-1+Q(9)kt=P*tH(H2P*t+R)-1(10)xt=x*t+kt
13、(yt-Hx*t)(11)Pt=(I-ktH)P*t(12)式中:x*t为t时刻的能耗预测值;xt为能耗优化估计值;Pt为能耗优化值协方差;P*t为能耗预测值协方差,包括卡尔曼增益kt在内,均为递推过程中的计算变量;yt为t时刻的功率采样值,是模型的外部输入。此时,剩余需确定的模型参数包括特定工作模式下工业设备平均能耗的初始状态x0、能耗优化值协方差初始值P0、功率-能耗观测关系H、能耗噪声协方差Q和功率噪声协方差R。3能耗预测模型的参数确定卡尔曼滤波在递推过程中不断用新的信息来修正估计值,随着时间序列的增加,初始时刻的系统状态值及其协方差的设定对后续状态的影响将衰减至接近于零。因此P0可以设
14、定为零,x0与H、Q和R的值可通过能耗、功率历史样本的离线统计计算得到。3.1正态分布参数的无偏估计在叠加高斯白噪声的前提假设下,工业设备的功率测量数据和能耗预测数据均服从正态分布,相关参数可通过历史样本的无偏估计来确定。假设现有总量为N的服从正态分布的数据样本,划分为M个样本集。在M个样本集中,样本集i的样本数量记作Ni,i=1,2,M,该样本集中的个体记作Xi,k,k=1,2,Ni。那么样本集i的算术平均值Xi和标准差Si可表示为Xi=k=1NiXi,kNi(13)S2i=k=1Ni(Xi,k-Xi)2Ni-1(14)电 力 系 统 及 其 自 动 化 学 报104第 7 期根据数学推理,
15、基于样本的正态分布均值及协方差参数2的无偏估计值7可表示为=i=1MXiM(15)2=i=1M(Ni-1)S2iN-M(16)由式(15)、(16)可知,R近似为基于功率样本计算的2;x0、Q分别近似为基于能耗样本获取的和2;基于卡尔曼滤波观测模型定义及vt为高斯白噪声的假设;H近似为功率样本的值与能耗样本的值之比。3.2样本预处理在实际应用场景中,功率和能耗的历史样本往往是混杂的。在进行无偏估计前,需要对样本进行聚类预处理,将样本数据与工业设备的不同工作模式对应起来,以得到正确的能耗预测模型参数。K-均值聚类算法是基于距离划分的非层次聚类算法,具有简单、高效、可扩展性好等优势8。假设工业设备
16、有L种工作模式,样本的聚类过程如下:步骤1建立功率-能耗二维空间,组合相同或相近时刻采集的功率样本和能耗样本,将其映射为二维空间中的坐标点;步骤2将二维空间中的所有坐标点随机归类到L个坐标组,分别计算各坐标组中功率和能耗的算术平均值,将所得算术平均值作为该坐标组的中心点坐标;步骤3计算二维空间中所有坐标点到各坐标组中心点的欧拉距离,按照最小距离原则重新划分坐标点所属的坐标组;步骤4计算新的坐标组中心点;步骤5重复步骤3、4,直到各坐标组的组成不再发生改变为止。历史样本中可能含有的异常数据无法通过聚类筛除,它们的存在会影响能耗预测模型参数的无偏估计,因此在聚类后,还需要对聚类的数据做进一步的过滤
17、处理。格拉布斯准则主要用于检测具有正态分布特征单变量数据集内的异常值,相比拉依达法等其他检验法,格拉布斯准则对异常值的检验准确且更为灵敏9。基于格拉布斯准则的异常数据筛除步骤如下:步骤1记数据集中的数据个数为N,数据个体为Xk,k=1,2,N,计算该数据集的算术平均值X和标准差S;步骤 2找出该数据集中距离最大的数据Xmax=max1kN(|Xk-X|);步骤 3判断该数据是否满足异常标准,即|Xmax-X|g(a,N)S。其中,g(a,N)可根据选取的显著性水平a与数据集的样本个数N联合查表得到,如表1所示;步骤4如满足异常标准,剔除该数据;步骤5重复步骤14,直到数据集中不再检出异常数据为
18、止。格拉布斯准则适用于数值型单维数据集,聚类后的L组功率-能耗历史样本组合需要按照数据语义进一步划分为功率数据集和能耗数据集,对各数据集独立实施异常数据筛除。经过异常数据筛除后的功率样本集和能耗样本集可通过第3.1节中无偏估计获得各工作模式下对应的能耗预测模型参数。4模型验证及应用测试工业设备在特定工作模式下运行时,能耗预测模型在t时刻的能耗预测值x*t结合该时刻功率观测数据可得t时刻的能耗最优估计值xt,xt在数值上与下一时刻的能耗预测值相等,既可作为下一时刻能耗测量数据丢失时的缺失填补,也可作为当前时刻能耗测量数据是否异常的自适应衡量标准。本节通过实际场景对第3节中的模型应用进行验证。4.
19、1模型验证及应用测试说明某铜材加工企业的一条400 V用电线路为1台上引炉设备供电。该设备基于生产工艺有4种能耗模式,简记为A、B、C、D。模型验证过程如下:步骤1获取上引炉设备的能耗及功率历史数据,按顺序进行聚类、筛除、无偏估计,获取4种工作模式下的能耗预测模型参数;步骤2对特定工作模式下的上引炉设备进行功率和能耗测量数据采集,获取实验数据;步骤3使用步骤1确定的模型参数部署卡尔曼滤波能耗预测模型,基于实验数据进行预测计表 1格拉布斯临界值示例Tab.1Examples of Grubbs critical valueN808182g(0.1,N)2.9402.9452.949g(0.05,
20、N)3.1303.1343.139g(0.01,N)3.5213.5253.529刘亮等:卡尔曼滤波能耗预测模型及其应用105第 35 卷算,并与其他预测模型进行横向比较。应用测试步骤如下:步骤1基于模型验证过程所获取的实验数据,模拟并测试能耗预测模型在能耗测量数据缺失自动填补方面的应用。步骤2基于模型验证过程所获取的实验数据,模拟并测试能耗预测模型在能耗测量数据异常波动的自适应检测方面的应用。上述步骤中所有的数据计算处理使用Python编程语言实施。4.2能耗预测模型参数计算获取上引炉设备的功率和能耗测量数据原始历史样本,使用K-均值聚类算法进行聚类。聚类计算使用基于Python语言的Sci
21、kit-Learn所提供的K-均值算法模块实施,原始样本数据的聚类结果如图1所示。基于聚类的样本数据,进一步采用显著性水平为0.05的格拉布斯准则对聚类的样本数据实施异常数据筛除处理。处理后的聚类样本数据如图2所示。图2中描述工作模式A和B的部分聚类样本数据示例见表2。其中,PA为模式A的功率数据;WA为模式A的能耗数据;PB为模式B的功率数据;WB为模式B的能耗数据。(a)模式 A 聚类图 1原始样本的 K-均值聚类Fig.1K-means clustering of original samples150100500功率值/kW能耗值/(kWh)20140406080100120(b)模式
22、 B 聚类120100806040功率值/kW能耗值/(kWh)140230150180 190 200160 170210 220(c)模式 C 聚类1751501251007550功率值/kW能耗值/(kWh)220270240250230260(d)模式 D 聚类25020015010050功率值/kW能耗值/(kWh)260340280290270300310320330(a)模式 A 聚类图 2聚类样本实施格拉布斯准则过滤Fig.2Clustered samples filtered by Grubbs criterion(b)模式 B 聚类(c)模式 C 聚类(d)模式 D 聚类1
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 卡尔 滤波 能耗 预测 模型 及其 应用
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。