基于人工智能算法的智慧数据模型及精准供热控制系统.pdf
《基于人工智能算法的智慧数据模型及精准供热控制系统.pdf》由会员分享,可在线阅读,更多相关《基于人工智能算法的智慧数据模型及精准供热控制系统.pdf(13页珍藏版)》请在咨信网上搜索。
1、基于人工智能算法的智慧数据模型及精准供热控制系统张宇阳1,李甲年1,杨怀滨1,李璟旭1,夏青2,曹嘉伟2(1.天津市津能滨海热电有限公司,天津 300453;2.天津能源物联网科技股份有限公司,天津 300384)摘要:采用知识挖掘和数据分析技术、数据智能处理技术,结合供热系统实际情况,建立基于人工智能算法的数据模型及控制系统,实施热量按需分配和节能提质策略,开发以智能控温为主的智慧化供热调控系统,可实现二次网数据采集与管理、机组控温预测下发、实时户温与热耗分析、楼栋供热平衡诊断等功能的业务系统。该系统的开发与应用可以帮助供热公司利用现行的大数据和机器学习技术,指导供热调控,精细化地提升热网调
2、度运行管理水平,对提高供热舒适度和指导供热节能减排有着重要意义。关键词:智能控温;线性回归;聚类分析;机器学习;精准供热DOI 编码:10.16641/11-3241/tk.2023.04.0131引言近年来,随着供热行业的飞速发展,如何提升供热质量,促进节能提质,实现智能化精准调控,成为供热公司的重点课题。传统供热企业在对热源、供热管网、热力站及热用户系统的运行调度过程中,大多依据现场人员的个人经验,根据外界气象状况或者二次管网回水温度来调节热负荷供给量,存在个性化差异以及稳定性差、随意性强、调控不及时等问题,不仅出现热用户“近热远冷”和暖气片“上热下冷”等影响供热质量的现象,还造成了能源的
3、浪费。随着现代科技的发展和数字化、智能化技术的普及,供热运行调度方式需结合人工智能和大数据技术加以改进。目前,许多供热行业的学者对智慧供热和信息化数字化调度做了一定的研究。钟崴 1提出智慧供热系统中需要着重运用“模型”和“数据”,基于系统基本功能,结合大数据技术与智能优化算法,构建供热生产的运营管理决策支持技术引擎。王庆峰 2以实际供热工程中某小区的热负荷历史数据为样本,研究人工神经网络技术在热负荷预测中的应用,并对其结果进行分析,发现将人工神经网用于热负荷调控能够获得较高的精度。王富有等 3在供热公司的供热调度中通过合理的数据采集与网络架构设计,在控制层面上实现了机组与热网的实时智能调度。董
4、妍 4指出气象数据作为一项重要因素,对供热生产调度运行有着巨大影响,对供热气象数据进行深入分析,可以提高供热的精确性。甄浩然 5明确提出通过二次网的水力平衡调节,消除楼间的水平失衡与垂直失调,解决冷热不均,实现水力平衡,可以显著节约供热企业的成本。本项目研究的内容是把基于人工智能的智慧供热技术引入到换热站机组,通过采集58区域供热 2023.4 期和分析供热机组的相关数据,实现对热负荷的可监测、可调节、可计量、可预测,从而实现换热站机组系统安全、经济、高效、智能化的运行。本项目应用智能化技术手段的过程,包括各类数据的处理和分析,机器学习的原理和方法,智慧供热控制模型的设计和呈现,研究如何结合智
5、能化技术进行运行调控,使机组和热网达到最佳的经济运行模式和供热效果,实施全过程全系统的智能监控,在满足用户采暖需求的同时,实现能源的节约,应用于天津某供热公司,有效消除了原有的依据人工设置数据进行温度曲线下发调控的不稳定性,利用数字化、智能化手段实现按需供热、精准供热,系统性地提升了供热舒适性和节能降耗水平。2 技术路线及过程2.1 技术路线本项目选择天津某热电公司提供的某小区作为试点,该小区具有全面的物联网采集和控制设备设施(换热站运行数据、热计量数据、室温数据、气象数据、各类智能泵阀数据等)作为数据源,采用如图 1 所示的技术路线过程。2.2 数据预处理本项目研究数据包括热电公司热表采集的
6、热计量数据、机组运行数据,气象单位提供的环境数据和小区建筑特性数据,通过在典型热用户安装的测温设备采集(安装比例为小区总用户的约 10%)用户室温、湿度等参数。热计量数据包括小区编号、用户编号、表号、累计流量、累计热量、热功率、流速、入水温度等参数;机组数据包括采集时间、一次供水温度、一次回水温度、一次供水压力、一次回水压力、二次供水温度、二次回水温度、二次供水压力、二次回水压力、瞬时流量、累计流量、累计热量等参数;气象数据包括时区、时间、温度、最大温度、最小温度等参数;建筑特性数据包括楼号、层数、门牌号、朝向、供热面积等参数。将上述 4 类数据对应至小区、机组和热用户,对应采集时间进行匹配整
7、合,得到一条包括供热计量、机组数据、环境数据和建筑特性数据的完整原始数据。由于设备故障、通讯故障、数据进入系统队列延迟等情况,原始数据存在一定的异常、数据缺失和逻辑错误,不能直接用于智能控制逻 辑 和 结 果 的 推 算 工 作,本 项 目 使 用3sigma 原则对各项数据进行预处理,将数值分布范围超出-3,+3 的数据剔除。2.3 数据的回归算法回归分析用于通过从隐藏于大量数据中的数据特征,得到变量间的相关关系,并利用概率论相关知识进行分析,判别相关关系的有效性,也可以利用变量间的关系式,由一个或多个变量去预测和控制另一个变量。经过预处理的原始数据即可用作分析研究的主体。构造回归模型时,以
8、实测室温为因变量,通过多项式回归、多元线性回归、小批量梯度算法,根据相关性强排列原则对自变量供热计量数据、机组数据、环境数据和建筑特性数据进行筛选。2.3.1 多项式回归研究一个因变量对应的一个或多个自变量间多项式的回归分析法,称为多项式回归。多项式回归一般模型为:(h(x)=0+1x+2x2+nxn(1)式中:x已知的数据;0,1,2,n位置参数。多项式回归问题可以通过变量转换为多元线性回归问题来解决,对于一元 n 次多项式回归方程,令:x1=x,x2=x2,x3=x3,xn=xn图1 技术路线图68区域供热 2023.4 期便转换为 n 元多元线性回归方程。由此可知,多项式回归方程中的参数
9、估计可以利用多元线性回归中参数估计得出。2.3.2 多元线性回归模型在研究线性相关性条件下,两个及多个自变量对应其中一个因变量,称为多元线性回归,多元线性回归一般模型形式为:Y=0+1X1+2X2+3X3+jXj+nXn+(2)式中:0回归常数;j(j=1,2,n)回归系数;随机误差;X1,X2,X3,Xn自变量或解释变量。由式(2)表示方程的矩阵表达式为:Y=X+(3)式中:X1 行 n+1 列的自变量矩阵 X0 X1 X2 X3Xn,X0=0;n+1 行 1 列的系数矩阵0 1 2 3kT。式(3)中的最小二乘估计值为:=(XT X)-1 XT Y(4)得出参数后,则求得样本多元线性回归方
10、程,计算得出多元线性回归模型后,应对其进行检验,判定其可靠程度,回归模型的评价指标包括 MSE(平均平方误差)、RMSE(平均根误差)、MAE(平均绝对误差)、R Squared(可决系数)即拟合优度检验。2.3.3 小批量梯度下降算法梯度下降法是机器学习中常用的优化算法,一般分为三种:批量梯度下降,每次迭代通过整个样本数据集来进行优化;随机梯度下降,每次迭代随机选择样本数据集部分数据来进行优化;小批量梯度下降,是对批量梯度下降以及随机梯度下降的折中方法,每次迭代都使用 batchsize(批量大小)个样本数据进行优化,继承了前两种算法的优点,克服了它们的缺点。梯度下降算法步骤如下:第一步:确
11、定优化模型的函数和损失函数假设模型为:h(x)=0 x0+1 x1+2 x2+n xn(5)式中:x1,x2,xn自变量;1,2,n对应自变量的偏移量;n样本数。其损失函数为:J(0,1,2,n)=12mmi=1(h(x(i)-y(i)2(6)式中:h(x(i)=0 x0+1x1+2x2+ixi,y(i)R;m小批量样本数量。第二步:初始化权重,给定一个初始值j第三步:算法过程确定当前位置的损失函数梯度;(1)步长乘以损失函数梯度,得到当前位置下降距离;(2)更新所有权重后,继续步骤一;(3)每次迭代对参数更新,见公式(7):j=j-1mmi=1(h(x(i)-y(i)x(i)j(7)式中:学
12、习率(步长);h(x(i)=0 x0+1x1+2x2+ixi,y(i)R;m小批量样本数量;0,1。2.3.4 共线性处理在多元回归分析中,当多个自变量之间存在精度/高度相关关系时,会导致回归系数难以估计,也就是出现了共线性的问题。本文采 用 方 差 膨 胀 系 数(variance inflation factor,VIF)来判断自变量之间是否具有共线性。VIF 是用来表征自变量之间共线性程度的数值,VIF 值越大,则变量之间的共线性程度越大。一般认为,VIF 值大于 10 表示具有较大的共线性。将所有可用于计算的自变量用 VIF 进行78区域供热 2023.4 期分析,比较其数值大小,最终
13、得到共线性较弱的 9 个变量,按 VIF 值降序排列为:入户水温度、出户水温度、二次供温、流速、室外温度、热功率、累计流量、收费面积、二次供压。其VIF 值如表 1 所示。表1 V I F值自变量名称VIF 值入户水温度6.559 594出户水温度4.899 303二次供温4.787 317流速3.984 609室外温度2.874 422热功率2.284 609累计流量1.577 415收费面积1.230 332二次供压1.080 3512.4 回归分析建立回归模型的基本指导思想是自变量数目少而精,略去一些对因变量有影响的自变量后,估算量产生了偏移,但是预测偏差的方差会下降。将表 1 的自变量
14、建立关于室温的线性模型,并使用逐步回归法迭代。逐步回归的基本思想是通过剔除变量中不太重要又和其他变量高度相关的变量,降低多重共线性程度。将变量逐个引入模型,每引入一个解释变量后都要进行 F 检验(方差齐性检验),并对已经选入的解释变量逐个进行 t 检验(主要用于样本含量较小的总体标准差),当原来引入的解释变量由于后面解释变量的引入而变得不再显著时,则将其删除,以确保每次引入新的变量之前回归方程中只包含显著性变量。这是一个反复的过程,直到既没有显著的解释变量选入回归方程,也没有不显著的解释变量从回归方程中剔除为止,以保证最后得到的解释变量集是最优的。逐步回归法的好处是将统计上不显著的解释变量剔除
15、,最后保留在模型中的解释变量之间的多重共线性不明显,对被解释变量有较好的解释贡献。通过逐步回归、筛选变量,剔除了二次供压,模型回归结果见表 2,样本量为 90 969,其中 R2 检验结果为 0.059,表示该多元模型非线性较强,AIC(赤量信息准则)和 BIC(贝叶斯信息准则)则是用于衡量模型复杂程度的重要评价指标,也能比较不同变量数目模型之间的优劣关系,二者的数值越小越好。表2 多元线性回归结果名称值名称值因变量 y R20.059观测值90 969R2 标准差 0.059自由度 90 969相似性检验-1.95105自变量数8AIC3.91105BIC 3.911053 聚类分析和建模3
16、.1 同质供热数据聚类聚类分析是一种数据分析方法,是一种无监督学习的手段,其目的是使相似数据点分布在同一类中,依据此方法将对象分为不同的组,组内的对象相互之间有相似的属性或者近似的关系。在分类时只依赖对象自己本身的属性。聚类分析多采用聚类算法的形式,本质是将总体中的个体进行分类,区分出不同类别中数据的差异和找到相同类别中的相似,这样就可以实现对每一类进行深入分析,以找到并概括出每一类的特点。3.2 t-SNE 算法目前数据的可视化还仅仅存在于三维及以下,对于超过三维的数据,需要对数据进行降维处理,才能实现数据的可视化。t-SNE 算法是一种非线性降维方法,其主要思想是认为在高维空间中靠近的点,
17、无论处在哪个维度,它们也应该是相互靠近的。t-SNE 算法对高维数据之间的欧氏距离用数据点之间相似性的条件概率来代替表示,然后对所需要的低维空间中的映射点构建 t 概率分布。然后计算两个维度分布的 Kullback-Leiber(KL)散度,使用梯度下降的方式,极小化 KL 散度的88区域供热 2023.4 期值,使得两个分布尽可能一致,达到保存数据特征的目的。t-SNE 算法求出的低维结果分布在联合概率分布上,其横纵坐标为映射在概率分布上的值。假设高维数据点的集合为 X=x1,x2,xn,在低维空间中的映射点集为 Y=y1,y2,yn,P、Q 分别为高维空间和低维空间的概率分布,pij、qi
18、j分别为 P、Q 的矩阵元素。在 t-SNE 算法中,xi会以条件概率 pj|i选择 xj作为其相邻点。pj|i越大,则 xj越靠近 xi,反之则越远离。在 t-SNE 算法中,联合概率分布 pij 是对称条件概率:pi j=pj|i+pi|j2n(8)pj|i=e-xi-xj22i2kje-xi-xk22i2(9)qi j=(1+yi-yj2)-1kl(1+yk-yl2)-1(10)使用 KL 散度创建函数:C=K L(PQ)=ijpi jl o gpi jqi j(11)其梯度为:C yi=4j(pi j-qi j)(yi-yj)(1+yi-yj2)-1(12)3.3 聚类分析特征值提取以
19、往的数据模型推算研究中,在同一机组下往往采用同一个模型进行拟合。这使得模型在拟合已知数据时表现结果较好,但在推算未知数据时,误差不能够满足实际生产需求,也就是泛化效果较差。根本原因是模型没有抓住研究对象,即热用户之间的本质和户与户之间的差异性,研究试点的同一小区下的两个机组(中区机组 51 户,低区机组 167户),对入户水温度、出户水温度、二次供温、室外温度特征进行 k-means(硬聚类算法)聚类。其步骤是将热用户数据按机组分为 K组,随机选择 K 个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离,聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本,聚类的聚类
20、中心会根据聚类中现有的对象被重新计算。当聚类中心不再发生变化时,输出聚类结果。聚类结果以各组数据均值作为区分,分为高和低两种类别。可视化展示需要进行降维处理,降维后的聚类数据,其 k-means 中围绕初始质心点选取如图 2、图 3 所示,经过这样的多次聚类,聚类中心是类似坐标概念,其每个属性值是这个聚类在该属性的平均值,因此存在属性值为负的情况,将属性值带入后续的人工神经网络模型。表3 中区同质热用户聚类数目类别说明中区机组数据条数0 类高入水温度+高二次供温3 4111 类高入水温度+低二次供温2 9172 类低入水温度+高二次供温3 6283 类低入水温度+低二次供温2 1174 类高入
21、水温度+高室外温度2 9935 类高入水温度+低室外温度3 5886 类低入水温度+高室外温度3 1687 类低入水温度+低室外温度2 540合计24 362表4 低区同质热用户聚类数目类别说明低区机组数据条数0 类高入水温度+高二次供温7 9351 类高入水温度+低二次供温9 6332 类低入水温度+高二次供温4 8033 类低入水温度+低二次供温9 5814 类高入水温度+高室外温度10 8235 类高入水温度+低室外温度3 5756 类低入水温度+高室外温度6 1657 类低入水温度+低室外温度5 4578 类高二次供温+高室外温度9749 类低二次供温+低室外温度7 661合计66 6
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 人工智能 算法 智慧 数据模型 精准 供热 控制系统
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。