基于小样本数据差分扩容的微电网负荷预测方法.pdf
《基于小样本数据差分扩容的微电网负荷预测方法.pdf》由会员分享,可在线阅读,更多相关《基于小样本数据差分扩容的微电网负荷预测方法.pdf(7页珍藏版)》请在咨信网上搜索。
1、基于小样本数据差分扩容的微电网负荷预测方法贾巍,黄裕春(广东电网有限责任公司广州供电局,广东广州510620)摘要:面向新能源微电网负荷预测,针对中长期负荷预测中样本数据不足导致预测精度不高的问题,提出了一种新的数据扩容方法,将原始数据样本两两差分作为新数据样本,通过设置阈值进行数据筛选,在扩充数据样本的同时保证数据的准确性,分析了基于差分运算的数据扩容方法对于负荷数据不确定性的消除效果。考虑气象、人口等影响因素,利用多元回归分析拟合各种关联因素对负荷的影响,将原始数据负荷预测模型作为对照,通过比较预测结果与实际负荷之间的误差,验证了数据扩容方法的实用性和准确性。关键词:负荷预测;小样本数据;
2、回归分析;微电网DOI:10.11930/j.issn.1004-9649.2022090350 引言近年来,用户的用电行为受各类新技术影响,日益复杂,负荷的波动性和不确定性日益增强1-4。特别是在接入大量新能源发电的微电网中,负荷的不确定性制约了新能源出力调度的灵活性,所以要求负荷预测的精确性更高、速度更快,但同时微电网受规模所限,很难有大量可利用的数据5-7。针对上述问题,负荷预测的目标转变为如何有效利用有限的数据精确预测负荷8-11。文献 12 建立了支持向量机的精细化负荷预测模型,将负荷数据与温度、湿度等大气数据相融合。文献 13 为解决电网数据海量化、高维化而导致的计算资源不足,建立
3、了基于在线序列优化的极限学习机短期电力负荷预测模型。文献 14针对集中式负荷预测效率和精度低的问题进行电力系统短期负荷预测。文献 15 将分形特性的自相似性引入节假日短期负荷预测,剔除气象突变、调休政策带来的不利影响。文献 16 针对电力系统负荷受天气、季节、工作日、周末和节假日等多种不确定外部因素影响的问题,建立了一个高精度的负荷预测模型。文献 17 针对用户级综合能源系统多元负荷波动性和随机性较强、精确预测难度较大的问题,提出了一种基于变分模态分解和多模型融合的超短期负荷预测方法。文献 18针对传统负荷预测方法缺少对时序数据相关性、特征值的全面考虑等问题,提出一种基于优化的变分模态分解、最
4、小冗余最大相关性与长短期记忆神经网络的组合预测模型。然而对于大多数中长期负荷预测而言,由于与国内生产总值(GDP)、人口等宏观数据密切相关,在有限的时间范围内,样本数据相对不足,无法通过大数据提升求解精确性,属于小样本数据分析问题。在电力行业中,小样本数据分析主要用于设备性能、可靠性、投资等的预测和估算。文献 19利用改进 Bootstrap 法扩容电气设备小样本性能数据,并基于此,进一步提出可靠性评估与预测模型。文献 20 针对小样本可靠性特征量的估计引入了修正极大似然估计公式,修正后的相对误差有明显减小。文献 21 关注工程造价的估算问题,通过小样本数据学习的思路,提出基于向量回归的估算模
5、型,在工程造价和影响因子之间建立了映射关系。在负荷预测方面,也可以利用小样本数据分析扩充数据量,求解负荷与各关联因素间的关系,但在目前,尚未见相关方面的研究。小样本数据分析旨在利用有限的数据,尽可能得到精确的计算结果,主要有 2 种思路。1)精确建模,充分校验。利用先验知识,充分考虑多种建模形式,并对各类模型的计算结果进行校验,寻找最精确的方法。但先验知识获取困难、收稿日期收稿日期:20220909;修回日期修回日期:20230620。基金项目基金项目:中国南方电网有限责任公司科技项目(ZHKJXM20180011)。第第 56 56 卷卷 第第 8 8 期期中国电力中国电力Vol.56,No
6、.8Vol.56,No.82023 2023 年年 8 8 月月ELECTRIC POWERAug.2023Aug.2023151主观因素较强,因此这一思路应用性不强;2)扩充数据样本。将小样本数据通过扩容或拟合等方式进行一定规模的扩充,通过增加数据量提升计算结果的精确性。目前大多都是依照这一思路。目前较为常用的数据扩容方法包括蒙特卡洛法、Bootstrap 法、支持向量机等学习演化方法,虽然学习演化方法生成的数据量很大,但在原始数据样本较少的情况下,很难确保生成数据的准确性。因此,本文提出了一种新的数据扩容方法,即以原始数据样本两两数据间的差值作为新数据样本。该方法与学习演化方法相比,虽然扩
7、容能力不如后者,但操作简单,数据准确性强。本文扩容数据后,利用多元回归法拟合负荷对各关联因素的敏感度,实现了小样本数据下的中长期负荷预测。1 小样本数据分析法1.1 小样本数据差分扩容通常情况下,负荷大小与各关联因素的关系可拟合为幂函数的形式,即P=Kk=1Nn=0ankxnk(1)xnkank式中:P 为负荷大小;为第 k 类关联因素的 n 次幂;K 为关联因素数量;N 为幂指数最大值;为第 k 类关联因素的 n 次幂系数,表示负荷对各类关联因素的敏感度。不同因素的数据间通常存在 3 类问题,如图 1所示。1)精度不同。包括时间、空间等方面。例如,GDP 数据大多精确到月,而天气数据则精确到
8、天。图 1 中的因素 1 和因素 2 表示了这类问题。此时,精度低的数据自我复制,直到各类数据达到同一精度。2)数据缺失。在数据收集的过程中会发生数据缺失。图 1 中因素 1 和因素3 体现了这类问题,此时可以取相近数据进行替代。3)数据量纲不同。对数据进行归一化处理,可采用 min-max 标准化,Z-score 标准化等方法,把有量纲表达式变为无量纲表达式。x1,1,x1,M,x2,1,x2,M,xK,1,xK,M数据处理过程如图 1 所示。经数据处理后,共有 M 组 K 维数据,历史数据总量为 KM,样本集合可以表示为。根据现有研究,各相关因素之间是相对独立的关系,即函数中不存在各影响因
9、素的交叉项。与此同时,基于新的样本集合,采用多元回归算法可以得到各类系数的估计值。经过扩容的数据集合样本数量充足,可以满足估计系数的要求。0相较于原样本集合,扩容后的样本集合在数据规模上提升了一个数量级。只要 M3,新样本集合的数据量即有所扩充,且 M 越大,扩充幅度越大。对于数值较小的系数(gk),可以忽略此因素对负荷的影响。1.2 小样本数据的校验若想采用上述方法进行扩容,泰勒展开的高次项必须足够小,能够被忽略,否则无法求解。必须满足的必要条件为?xk,nxk,m?1(2)因此,须在进行数据归一化处理时,将数据全部归一化至(0,1)区间内,这样可以保证数据的差分满足上述条件。而且,上式的值
10、越小,说明两个样本数据的“距离”越小,则泰勒展开忽略高次项后的误差越小。因此,采取如下的小样本数据校验公式,有?xk,nxk,m?(3)(0,1)式中:称为阈值。认为所有满足上式的样x1,1x1,1x1,2x1,3x1,4x1,5x1,6x1,1x1,2x1,3x1,4x1,5x1,6x2,1x2,2x2,3x2,4x2,5x2,6x3,1x3,2x3,3x3,4x3,5x3,6x3,1x3,2x3,3x3,3x3,4x3,5x2,1x2,1x2,2x2,2x2,3x2,3x2,1x2,2x2,3x1,2x1,3x3,3x3,1x3,2x1,4x1,5x1,6x3,4x3,5类 1因素 1因素
11、 2因素 3按类扩展重新排序类 2类 3图 1 数据处理过程Fig.1 Data processing中国电力中国电力第第 56 56 卷卷152本数据组合运算是合格的,可以视具体要求而定。1.3 负荷不确定性影响实际上,本文提出的扩容方法不仅可以扩大数据的样本量,还可以减少数据不确定性带来的测算误差。历史数据值会受历史计量、统计及核算方法的影响而产生测算误差。例如 GDP 值会受 GDP计算方法的影响,人口数量会受统计方法的影响,气象因素会受测量方法的影响等。因此,根据历史数据求得的关联因素系数和负荷预测函数可能存在较大的测算误差。由于测算方法的改进应是一平稳过渡过程,通过差分运算,测算误差
12、会随着计算的次数增多而减小,本文提出的扩容方法减少了数据的测算误差。但是,当选取的历史数据时间跨度较大时,扩容方法反而会扩大数据的测算误差,因此,本文所提出的扩容方法对历史数据的筛选有如下 2 点要求。1)数据的时间跨度、地理位置跨度需要满足一定的要求,不能过大,适宜选取同一区域微网 5 年之内的负荷数据及关联因素数据;2)数据的测算误差应该远大于精确度误差等随机误差。对于负荷数据和关联因素数据,在统计过程中是满足这一条件的。2 负荷预测分析方法负荷变化关联因素主要分为以下几类。1)气象因素:在各类气象因素中,气温对负荷的影响最大,空调、取暖设备等都属于温度敏感性负荷,负荷大小与温度的绝对值大
13、小正相关。湿度通常与负荷呈负相关性,即湿度越大,负荷越低。而雨雪对负荷的影响主要体现在农机灌溉负荷,以及用以应对极端天气的负荷上。风速、光照强度等气象因素也会通过影响分布式电源出力,影响负荷的用电模式。2)经济因素:经济因素包括 GDP、人均可支配收入、工业生产水平等方面,对于电力系统而言也包括电器设备数量变化、电力网络本身的管理策略等方面。这类因素在发展正常的年份具有长期单调递增、短期小范围波动的性质。3)人口因素:人口数量与电力需求大小正相关22-23。另外从业人口数量、人口年龄结构、家庭人口规模等因素都会对该地区的用电负荷产生影响,但各影响因素相互关联,并不彼此独立。4)负荷成熟度:在不
14、考虑特殊情况(例如自然灾害)的影响下,用户用电行为的发展具有规律性。一个地区在经济建设的初期阶段,电力负荷的增长比较慢,称为进入期;随着当地经济与社会的逐渐发展,电力系统负荷的发展加速,称为发展期;当经济社会发展到一定阶段之后,受当地能源结构、土地资源、环境条件和城市、电网规划政策等影响,负荷增长速度会放缓,呈现出饱和态势24。5)随机因素:即无法预知的因素,比如自然灾害等,同样会对用电量造成很大的影响。针对这些偶然的突发事件引起的负荷变化,无法做出任何预测,只能增加备用容量,以备不时之需。多元回归分析是指在函数关系中将一个变量视为因变量,多个变量视为自变量,建立多个变量之间线性或非线性数学模
15、型,并利用样本数据分析计算得到模型表达式的统计分析方法。以线性回归为例,设因变量为 Y,自变量分别为 X1,X2,XN(N 为自变量数量),假设所有自变量对因变量的影响都是线性的,则回归模型为Y=0+1X1+2X2+NXN+(4)i(i=1,2,N)式中:为回归系数;为随机误差项。3 算例分析采集某区域微网 20162019 年间的负荷数据、天气数据、GDP 数据及人口数据进行 2020 年月度负荷预测。天气数据中包含气温、降水量、日照时长及湿度数据,变量定义如表 1 所示。表 1 变量定义Table 1 Variable definition负荷天气总人口总GDP平均气温降水量日照时数相对湿
16、度YX1X2X3X4X5X6(0,1)首先对缺失和精度不同的数据进行替代和复制,再对得到的数据进行归一化处理,消除因量纲不同所带来的影响,并将数据归一化至,即x=xxmaxxmin(5)第第 8 8 期期贾巍等:基于小样本数据差分扩容的微电网负荷预测方法153xminxmax式中:x 为原始数据;为全部样本中的最小值;为全部样本中的最大值。为保证对 2020 年进行预测时,其标幺值不超过 1,基准值选择 20162019 年间的所有样本的最大值和最小值。数据筛选的阈值 取定为 0.4。考虑影响负荷增长模型的两个系数。1)商业负荷的成熟度:简化考虑,商业负荷的 k 值一般取 0.7,即竣工后第二
17、年就增长到远景负荷的80%。2)商业用户的报装容量:商业用户报装容量的实际使用率通常较低,根据文献 25 实际负荷为报装容量的 0.16 倍。设置案例如下。案例 1 为数据扩容前进行一次回归分析;案例 2 为数据扩容后进行一次回归分析;案例 3 为数据扩容前进行二次回归分析;案例 4 为数据扩容后进行二次回归分析。应用 IBMSPSS 软件进行多元回归分析,得到结果如表 25 所示。其中常数代表拟合曲线的常数项,回归系数为对应变量在曲线拟合中的系数值,如 X1为变量 X1在拟合曲线中的一次系数,X12为变量 X1在拟合曲线的二次系数,以此类推。表 2 案例1 结果Table 2 Result
18、of case 1常数X1X2X3X4X5X64.0580.0340.0220.0100.0284.1360.465表 3 案例2 结果Table 3 Result of case 2常数X1X2X3X4X5X60.0440.0340.0220.0100.0284.1360.465表 4 案例3 结果Table 4 Result of case 3常数X1X12X2X22X3X32X4X42X52X622.2270.4530.4850.0890.0790.4420.4390.3090.1451.9940.304表 5 案例4 结果Table 5 Result of case 4常数X1X12X
19、2X22X30.0490.2280.4850.0620.0800.212X32X4X42X5X52X620.4430.0460.16114.545849.6092.125根据回归模型,对 2020 年负荷进行预测,做出负荷预测值和实际值对比图,如图 2 所示。作出预测误差对比,如图 3 所示。分析结果可以得到如下结论。1 5001 4001 3001 2001 1001 000900800700负荷/MW123456789101112月份实际值;案例 3 实际值;案例 1、2 预测值;案例 4 预测值图 2 负荷预测值与实际值对比Fig.2 Forecasted load compared t
20、o actual load864202468负荷预测误差/%123456789101112月份案例 3 误差;案例 1、2 误差;案例 4 误差图 3 预测误差对比Fig.3 Contrast on prediction error1)案例 1、2 的回归分析结果相同,说明基于差分的数据扩容方法不适用于线性回归;案例3、4 的回归分析结果不同,案例 4 可以将案例3 中因算法缘故排除的变量“X5的一次项”重新拟合到回归方程中,在一定程度上弥补了回归算法的局限性,充分体现了所有关联因素的影响,说明该方法适用于高次回归。2)案例 1、2 的预测结果并不理想,相对误差普遍较大,而平均相对误差达到了
21、5.046%,说明关联因素的二次项相对于一次项而言并不能被忽略,直接采用线性回归的方法并不可取。3)案例 3 的预测结果有所提升,平均相对误差达到 3.229%,说明二次回归优于一次回归;而案例 4 的预测结果比案例 3 更好,平均相对误差低至 1.89%,由图 3 可见案例 4 相对误差的方差也是最低的,说明基于差分的数据扩容方法具有更好的稳定性和准确性。中国电力中国电力第第 56 56 卷卷1544 结论针对新能源微电网中的负荷预测问题,本文提出了基于差分思想的小样本数据扩容方法,在对精度不同、完整度不同的数据进行复制、替代的基础上,通过对原始数据集两两差分得到新数据集。推导过程说明新数据
22、集中自变量和因变量具有很好的函数关系,依此可以建立新的回归分析模型,并根据电力负荷自然增长对模型做出修正。通过算例分析得到如下结论。1)基于差分的数据扩容方法不适用于线性回归,但适用于高次回归,通过数据差分可以减少有效数据的舍弃,弥补回归算法的局限性。2)基于差分的数据扩容方法具有更好的稳定性,该方法可以有效地保证数据的准确性,确保关联因素数据中的内在联系不被破坏,从而准确求解回归方程,精确预测长期负荷。参考文献:袁小凯,李果,黄世平.基于大数据技术的多变量短期电力需求预测研究 J.电网与清洁能源,2020,36(12):3034,40.YUANXiaokai,LIGuo,HUANGShipi
23、ng.Multi-variableshort-termpowerdemandforecastingresearchbasedonbigdatatechnologyJ.PowerSystemandCleanEnergy,2020,36(12):3034,40.1李志敏.基于数据挖掘的工业用户用电行为分析及辨识研究 D.沈阳:沈阳工业大学,2022.LIZhimin.AnalysisandidentificationofindustrialuserselectricityconsumptionbehaviorbasedondataminingD.Shenyang:ShenyangUniversit
24、yofTechnology,2022.2何宗泽.基于数据挖掘的用户用电行为分析研究 D.长春:吉林大学,2022HEZongze.Analysisandresearchonuserselectricityconsumptionbehavior based on data miningD.Changchun:Jilin University,2022.3杨彪,颜伟,莫静山.考虑源荷功率随机性和相关性的主导节点选择与无功分区方法 J.电力系统自动化,2021,45(11):6167.YANG Biao,YAN Wei,MO Jingshan.Pilot-bus selection andnetwo
25、rkpartitioningmethodconsideringrandomnessandcorrelationof source-load powerJ.Automation of Electric Power Systems,2021,45(11):6167.4王永伟,李新龙,田斐,等.基于人群搜索算法的电网短期用电负荷5预测研究 J.电网与清洁能源,2020,36(12):3540.WANGYongwei,LIXinlong,TIANFei,et al.Researchonshort-termelectricloadforecastingofpowergridbasedoncrowdsea
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 小样 数据 扩容 电网 负荷 预测 方法
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。