基于接壤城市数据的居民用气量复合模型及预测.pdf
《基于接壤城市数据的居民用气量复合模型及预测.pdf》由会员分享,可在线阅读,更多相关《基于接壤城市数据的居民用气量复合模型及预测.pdf(7页珍藏版)》请在咨信网上搜索。
1、662023 年 8 月第 35 卷第 4 期油 气 与 新 能 源文章编号:2097-0021(2023)04-0066-07基于接壤城市数据的居民用气量复合模型及预测王歌,刘世章,戴松霖昆仑数智科技有限责任公司引用:王歌,刘世章,戴松霖.基于接壤城市数据的居民用气量复合模型及预测J.油气与新能源,2023,35(4):66-72.基金项目:中国石油天然气集团有限公司科学研究与技术开发项目天然气销售领域智能化数字化转型技术研究下属课题智慧天然气销售服务软件研发(2021KY325)摘要:居民用天然气是天然气利用中需要优先保障的类型,其规模的准确预测是实现资源合理采购、管道安全输送、市场稳定供
2、应的基础。但自 2017 年以来的供暖季却屡屡出现“气荒”、天然气限供,尤其是大气污染防治推行“煤改气”之后,冬季“气荒”或成常态,这些表明对天然气需求进行较为准确的预测意义重大。基于 20202022 年北方某省相关城市的居民用天然气数据及统计年鉴数据,针对无法获取到历史数据的城市难以准确预测天然气需求的问题,使用与目标城市接壤的相关城市数据,并将回归分析与随机森林模型相结合,建立了目标城市居民用气规模的中期预测模型,并对目标城市 20212022 年的居民用气规模进行预测。实证结果表明,在历史数据不足的情况下,可以利用经济、人口、气候等宏观数据和接壤城市用气数据进行建模,以实现对目标城市居
3、民用气规模的合理预测。关键词:城市燃气;居民天然气需求;回归分析;随机森林;区域预测中图分类号:TU996.3 文献标识码:A DOI:10.3969/j.issn.2097-0021.2023.04.010Prediction of Residential Natural Gas Consumption Using a Composite Model Based on Data from Neighboring CitiesWANG Ge,LIU Shizhang,DAI SonglinKunlun Digital Technology Co.,Ltd.Abstract:Residentia
4、l natural gas is the type that must be ensured first in natural gas consumption.Accurate forecast of its magnitude is required for reasonable resource acquisition,secure pipeline transit and consistent market supply.However,since 2017,“gas shortages”and natural gas supply limitations have been commo
5、n throughout the heating season.Winter“gas shortages”may become the norm,especially with the installation of“coal-to-gas”for air pollution prevention and control.As a result,it is critical to more correctly anticipate natural gas consumption.Based on residential natural gas data and statistical year
6、book data from a relevant city in a northern province from 2020 to 2022,and to address the issue that it is difficult to accurately predict natural gas demand in cities that lack historical data,and by using data from cities bordering the target city and combining regression analysis with the random
7、 forest model,a medium-term prediction model of the target citys residential gas demand was developed,which was used to forecast its residential gas consumption from 2021 to 2022.The empirical results suggest that,in the absence of appropriate historical data,macro variables such as the economy,popu
8、lation and climate,as well as gas consumption data from neighboring cities,may be used for modeling to obtain a realistic forecast of the scale of gas consumption of inhabitants in the target city.Keywords:City gas;Residential gas demand;Regression analysis;Random forest;Regional forecast0引言随着中国城镇化率
9、的不断提升,以及“碳达峰、碳中和”目标的提出,作为清洁能源,天然气在能源消费中的占比快速增加。国家能源局发布的中国天然气发展报告(2021)显示,2020 年全国天67第 35 卷第 4 期2023 年 8 月王歌等:基于接壤城市数据的居民用气量复合模型及预测然气消费量同比增长 6.9%,从消费结构看,城市燃气同比增长 10.5%,占比 32%1。其中,根据国家统计局公布的数据,2020 年居民生活天然气消费总量为 560108 m3,同比增长 11.5%。可以预见的是,未来随着城市燃气的发展和“煤改气”逐步推进,居民用天然气的市场份额将不断扩大。作为城市燃气中的基础,居民用气的稳定供应关乎百
10、姓民生。然而,近年来供暖季“气荒”现象却频频出现,利用历史数据对居民用气规模进行准确预测,以实现对天然气资源采购、管网铺设及市场销售的合理规划,成为当下亟待解决的问题。目前对于居民用天然气需求预测的研究按照时间跨度可分为短期、中期、长期预测 3 种:短期预测通常是预测未来一周、一天或者一小时的负荷,以对天然气短时间内的使用情况提供理论依据,实现资源的合理调配;中期预测一般是以月或者季度为单位进行预测,为决策者合理安排计划、进行人员调动、设备维修维护等提供指导;长期预测通常以年为单位,通过对宏观数据的预测,为城市提供管道建设的理论依据2。在模型选择上,既有时间序列模型、回归模型、灰色预测、不均匀
11、系数等传统预测模型,也有为处理大规模数据中所蕴含的规律而使用的 SVM(支持向量机)、小波分析、神经网络等深度学习模型,还有由此衍生出的用以提升预测精度的组合模型,包括对组合中各预测方法加权平均、多个模型结果取最优、将一个模型的输出结果作为另一个模型的输入等组合方式。针对不同类型的天然气需求预测,学者们选择了不同的数学模型对其进行预测。胡凯3利用20152018 年合肥燃气公司的季度数据拟合 Holt-Winter 加法模型实现了对燃气负荷的季度预测,最终将模型的预测误差控制在 10%以内。武海琴4在对北方某城市的冬季用气数据进行分析后,建立了居民用气负荷与日均气温的回归模型,得到较好的预测效
12、果。张超等5使用支持向量机建立以气候因素为主要因素的预测模型,最终预测结果与实际值误差在 2%左右。在组合预测上,舒漫6 利用成都市天然气日负荷数据及季度负荷数据,建立 了 XGBoost(eXtreme Gradient Boosting,极 端 梯度提升)预测模型,将预测平均绝对百分比误差降 至 2.1%。通过以上文献的梳理可以看到,以往对居民用天然气需求的预测研究,更多的是基于目标城市的居民用天然气消费数据,通过拟合模型实现对未来需求的预测,但是该类方法不能对无法获取历史数据的城市进行预测。因此,考虑到同省份地域接壤城市在居民用气习惯、天然气市场份额、管网规划等方面往往具有相似性,本文拟
13、使用同省份与目标城市接壤城市的宏观统计数据和历史用气数据,利用回归分析和随机森林模型相结合的方式,建立居民用气需求预测模型,提升模型的可解释性与准确度,实现对无法获取历史数据的城市居民用天然气需求量的准确预测。本文所预测的居民用气数据颗粒度为城市居民用气量的月度值。1模型设计1.1模型设计思路在实际的预测研究中,常常会遇到研究对象历史数据无法取得的情况,如在天然气新建管网时期,就需要在缺乏可参考数据的情况下对目标城市用气量进行合理预测。由于邻近城市的政策与经济发展状况相似、人口基数接近、生活习惯类似、气候相近,因此本文借鉴 Chong 等7、张璇等 8的思路,使用与目标城市接壤的地级市数据进行
14、模型的拟合。具体而言,在选择用于建模的城市时,主要考虑以下两方面:一是要综合考虑目标城市所属省份各城市的地理位置情况,选择与目标城市接壤的城市,例如对于内陆城市,则应在保证数据质量的情况下尽可能选择同样为内陆城市的接壤城市;二是考虑到接壤城市的历史数据应具有一定规模且用户用气情况稳定,因此本文以同省份各城市用户数量的中位数为标准,在符合条件的接壤城市中选择用户数量在中位数以上的城市。而在预测模型的选择上,本文使用回归分析与随机森林模型相结合的组合预测方式,具体流程如下:1)本文的研究对象是无法获取历史数据的城市,在变量选取上考虑与接壤城市有共通性的宏观变量,并采用定性与定量相结合的方式,即先根
15、据过往研究成果及接壤城市与目标城市的现状,定性居民用天然气消费量的影响因素,而后使用回归分析,定量确定影响需求预测的变量。2)将选定的变量传入随机森林模型,利用接壤城市数据构建居民用气量的预测模型,并以此来预68油气与新能源 政策与市场Vol.35 No.4 Aug.2023城市,预测其 20212022 年居民用气情况。同时,选择在 2022 年12 月 1 日零时,居民用户数量在 3 万以上的3 个 城 市 H 市、J市、A 市为 L 市的接壤城市,使用这 3 个城市的相关数据构建预测模型。为提高样本数据的代表性,本文对所使用的数据进行如下处理:由于原始数据为各城市居民用户的日用气量(远传
16、表上传),需要对居民日用气量进行分月加总,得到各城市的月度用气量;由于在远传表试运行阶段,用户规模及用气量有时会偏离正常值,有时也会存在数据冲正等情况,所以用气数据在其数据分布曲线的两端均存在较多异常值,因此对接壤城市数据进行双侧 10%的截尾处理(将大于 90%分位数或小于 10%分位数的取值替换为缺失值),以消除异常值对模型的干扰;由于各城市的经济收入数据为季度数据、人口数据为年度数据,考虑到这些数据在一定时间内具有相对稳定性,因此对其进行均值插补,即对于经济数据,季度内各月取季度均值,对于人口数据,年内各月取年度均值;由于各变量数据的数量级相差较大,因此使用Z-Score(标准分数,将一
17、个数与平均数的差再除以标准差,见公式(1)对各变量的数据进行标准化处理,以使模型在训练时能够更快的收敛到最优解。XXZs=(1)式中:Z标准分数;X原始数据;X 平均数;s标准差。图 2 为处理后的接壤城市各月用气量数据。表 1 为各城市居民月度用气量的描述性统计值,其中用气量一栏为截尾处理前的原始数据,Q 为截尾处理后的用气量数据,由于目标城市为预测对象,测目标城市的居民天然气用量。其中,随机森林建模过程如下:读入接壤城市数据,并确定随机森林模型中要进行调参的参数,以使模型有更准确地预测效果。本文选取了决策树个数、最大深度、最小分离样本数(拆分决策树的节点要求的最小样本数)、最小叶子节点样本
18、数(每个叶节点需要包含的最小样本数)、最大分离特征数(寻找最佳节点分割时要考虑的特征变量数量)等 5 个参数,并在模型训练过程中对各参数的范围进行划定,初步确定参数的最佳范围。在划定的范围之内,使用随机搜索(Randomized Search CV)的方式,将需要调参的各参数进行匹配,确定最佳的取值组合。为防止此时的最佳组合只是局部最优而非全局最优组合,需在最佳组合的临近范围内重新划定各参数的取值范围并进行网格搜索,通过多次循环此步骤找到最佳的参数组合。使用中的参数组合即可得到最终的随机森林预测模型。相比于以往的模型,此预测方法的优点在于:一是回归分析和随机森林模型均适用于中长期预测9,若单独
19、使用回归模型,则无法很好地应对冬季供暖期天然气用量大幅上升的情况,而随机森林模型可以随机选择样本与特征构建多个决策树,既提升了对冬季数据的拟合能力,也能很好地减弱过拟合的发生,同时还具有很好的鲁棒性;二是虽然随机森林有利于提升模型预测准确度,但在模型解释性上表现较差,回归分析则可以很好地弥补这一点。1.2预测流程基于上述模型设计思路,本文的预测流程见图 1。2数据来源与数据处理本文以北方某省份为研究对象,所使用的城市居民用气量数据来自某天然气公司的终端销售数据。该数据均为物联网远传表数据,每日定时上传用户当日用气情况,可以真实反映各市的民用天然气消费情况。考虑到用于研究的数据应处于各市的成熟用
20、气阶段,因此本文选取的建模数据时间范围为 20202022 年。本文所使用的宏观经济数据,是由该省份各城市统计局官方网站上公布的统计月报整理所得,并根据该省份统计年鉴10-11进行修正。在城市的选择上,本文以该省份 L 市作为目标收集接壤城市数据数据预处理建立回归模型,定量确定纳入预测模型的变量利用接壤城市数据,确定随机森林模型调参的参数,随机搜索匹配最优参数组合确定最佳参数组合模型预测与评价确定目标城市的接壤城市定性选取影响因素建立基于随机森林的民用天然气预测模型在最优组合附近缩小参数范围进行网格搜索全局最优?是否图 1预测流程图69第 35 卷第 4 期2023 年 8 月王歌等:基于接壤
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 接壤 城市 数据 居民 气量 复合 模型 预测
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。