基于指数核函数高斯过程回归的短期径流预测研究.pdf
《基于指数核函数高斯过程回归的短期径流预测研究.pdf》由会员分享,可在线阅读,更多相关《基于指数核函数高斯过程回归的短期径流预测研究.pdf(8页珍藏版)》请在咨信网上搜索。
1、中国农村水利水电China Rural Water and H基于指数核函数高斯过程回归的短期径流预测研究何中政1,3,方丽1,刘万2,迟英凡1,王永强2,付吉斯1,3,熊斌1,3(1.南昌大学工程建设学院,江西 南昌 330031;2.长江水利委员会长江科学院,湖北 武汉 4 30010;3.南昌大学 鄱阳湖环境与资源利用教育部重点实验室,江西 南昌 330031)摘要:径流预测有助于流域水资源综合高效调配和防洪减灾调度,如何精准地开展短期径流预测一直是水文水资源研究领域的重点。高斯过程回归(GPR)凭借其针对复杂非线性回归问题的泛化能力,已在水文过程长中短期预测研究中得到成功应用。而GPR
2、回归分析能力不仅取决于模型参数,还受核函数影响。为此,研究分析了不同核函数作用下GPR预测模型效果,提出了基于指数核函数GPR的流域短期径流预测模型。首先通过多重相关性系数分析筛选相关性系数大且时段最短的预测因子组合,然后分别选用有理二次、径向基、马顿和指数核函数建立不同的GPR短期径流预测模型,同时加入了MLR、RT、SVM、BP等模型方法的预测结果作为对比。以赣江流域吉安水文站短期径流预测(预测步长为6 h,预见期为7 d)为例开展实例分析,相关实验结果表明:应用不同核函数的GPR模型预测结果表现存在明显差异,不同方法预测表现由好到差分别为指数GPR、有理二次GPR、RT、马顿GPR、径向
3、基GPR、SVM、MLR、BP;指数GPR预测模型28时段的4项评价指标均表现最佳,DC和QR分别接近1和100%,预报精度达到甲级以上。综上,研究验证了指数核函数GPR短期径流预测模型的有效性和普适性,模型预测精度满足实际工程应用需求,具备实际应用价值。关键词:短期径流预测;高斯过程回归;指数核函数;赣江流域;吉安水文站中图分类号:TV124 文献标识码:A DOI:10.12396/znsd.230394何中政,方 丽,刘 万,等.基于指数核函数高斯过程回归的短期径流预测研究 J.中国农村水利水电,2023(8):25-31+40.DOI:10.12396/znsd.230394.HE Z
4、 Z,FANG L,LIU W,et al.Short-term runoff prediction based on exponential kernel gaussian process regressionJ.China Rural Water and Hydropower,2023(8):25-31+40.DOI:10.12396/znsd.230394.Short-term Runoff Prediction Based on Exponential Kernel Gaussian Process RegressionHE Zhong-zheng1,3,FANG Li1,LIU Wa
5、n2,CHI Ying-fan1,WANG Yong-qiang2,FU Ji-si1,3,XIONG Bin1,3(1.School of Architectural Engineering,Nanchang University,Nanchang 330031,Jiangxi Province,China;2.Changjiang River Scientific Research Institute of Changjiang Water Resources Commission,Wuhan 430010,Hubei Province,China;3.Key Laboratory of
6、Poyang Lake Environment and Resources Utilization,Ministry of Education,Nanchang University,Nanchang 330031,Jiangxi Province,China)Abstract:Runoff prediction is helpful to the comprehensive and efficient allocation of water resources and flood control and disaster reduction operation in the basin.Ho
7、w to accurately carry out a short-term runoff prediction has always been the focus of hydrology and water resource research.Gaussian process regression(GPR)has been successfully applied in the long,medium and short-term hydrological process prediction research because of its generalization ability f
8、or complex nonlinear regression problems.The GPR regression analysis ability de文章编号:1007-2284(2023)08-0025-07收稿日期:2023-03-17基金项目:国家自然科学基金(52209024);中央基本科研业务费(CKSF2021486/SZ);江西省水利厅科技项目(202223YBKT43);江西省自然科学基金(20212BAB214065);江西省水利科学院开放研究基金(2021SKSH01,2021SKSH02)。作者简介:何中政(1992-),男,讲师,博士,主要从事复杂水资源系统建模
9、及其优化调控方法研究。E-mail:he_。通讯作者:王永强(1982-),男,正高级工程师,博士,主要从事流域水资源演变、综合规划与调度配置方面的研究。E-mail:。水文水资源25基于指数核函数高斯过程回归的短期径流预测研究 何中政 方丽 刘万 等pends on not only the model parameters but also the kernel function.Therefore,this paper analyzes the effect of GPR prediction model under different kernel functions,and prop
10、oses a short-term runoff prediction model based on exponential kernel function.Through the multiple correlation coefficient analysis of the largest multiple correlation coefficient,and the shortest predictor period,and then the rational secondary,radial base,maton and exponential kernel function are
11、 chosen to establish different GPR short-term runoff prediction model,also joined the MLR,RT,SVM,BP model method prediction results as a comparison.Taking the short-term runoff prediction of Jian Hydrologic Station in the Ganjiang River Basin(the prediction step is 6 h,and the prediction period is 7
12、 days)as an example,the relevant experimental results show that:There are obvious differences in the prediction results of GPR models using different kernel functions,and the prediction performance of different methods from good to bad is exponential GPR,rational quadratic GPR,RT,Marton GPR,Radial b
13、asis GPR,SVM,MLR,BP;The 4 evaluation indexes of the exponential GPR prediction model in 28 periods all performed best,DC and QR are close to 1 and 100%respectively,the forecast accuracy reaches grade A or above.In conclusion,this paper verifies the effectiveness and universality of the exponential k
14、ernel function GPR short-term runoff prediction model,and the model prediction accuracy meets the needs of practical engineering applications with practical application value.Key words:short-term runoff prediction;Gaussian process regression;exponential kernel function;Ganjiang River Basin;Ji an Hyd
15、rological Station0引 言流域径流过程受众多因素的相互作用与影响,使得径流时间序列表现出复杂的非线性特性1,具有显著的非平稳、高维度和模糊性等复杂特征2,3,研究预测精度高和稳定性好的径流预测模型仍是当前水文水资源研究领域热点问题之一。而目前水文预测方法主要可分为过程(机理)驱动和数据驱动模型两大类:过程驱动模型以水文过程的物理机制或规律为基础4,需要大量且可靠的水文数据来建立模型,从而进行流域径流模拟或预测,但由于水文模型对水循环过程的简化处理,往往难以精准刻画非线性的径流过程,且由于部分水文数据资料缺失或可靠性差等因素影响,过程驱动模型在实际径流预报中存在局限性5;而随着计
16、算机硬件、软件和理论技术的发展,数据驱动模型依托统计学或其他人工智能技术,无需考虑水文过程物理机制6,通过对时间序列进行分析从而建立对预测对象和预测因子间复杂非线性关系刻画更为完备的模型,使得数据驱动模型在水文数据资料缺少或复杂非线性的径流过程将具有更好的适用性2。近年来,学者们将多种常见的人工智能模型引入到水文预测中,如前馈式神经网络7(Back-Propagation neural network,BP)、多元线性回归8(Multiple Linear Regression,MLR)、支持向量机9(Support Vector Machine,SVM)等,相关研究均取得了较好的效果10,如
17、何应用人工智能技术开展流域径流预测已经成为未来发展的重要研究方向之一11。高斯过程回归(Gaussian Process Regression,GPR)作为一种新型的机器学习方法,采用高斯过程对先验数据进行回归分析,以统计学理论为基础,在处理高维、非线性、小样本等复杂的回归问题时都具有很强的泛化能力,因而在各类研究领域得到应用12。黄亚等人3采用GPR模型在广西天峨水文站进行短期径流预测;孙斌等人13采用GPR模型在进行短期风速预测;李成宇14采用GPR模型进行了土石坝沉降预测研究;周靖楠等人15采用GPR模型与MI-KPCA结合在北汝河进行中长期径流预测。刘龙龙等人16采用GPR模型与蜻蜓算
18、法结合对居民社区时用水量动态实时区间预测。GPR模型已在非线性回归分析问题中得到成功应用,GPR回归分析能力不仅取决于模型参数,还受核函数影响,但目前核函数的影响还未得到进一步研究。Scholkopf和Smola17指出支持向量机和高斯过程两种算法的核函数是等价的,并提出几种高斯过程中可选择的核函数类型。因此,本文分析了不同核函数作用下GPR预测模型效果,并提出了一种基于指数核函数GPR的流域短期径流预测模型,以江西省赣江流域吉安水文站径流过程为对象例开展实例分析。1研究方法1.1高斯过程回归预测模型基本原理高斯过程(Gaussian Process,GP)是概率论和数理统计中随机过程的一种,
19、是一系列服从正态分布的随机变量的组合。GP继承了正态分布的诸多性质,其特征主要由数学期望和协方差函数决定。GPR则是对数据进行回归分析,来建立服从GP先验信息的非参数模型18。假设一个含有n对相互独立观测数据的学习样本X,y,其中X=x 1,x 2,x n是由n个输入向量组成的输入集,而y=y1,y2,yn是由 n个相对应的一维输出组成的输出集。那么GP的均值(x)和方差k(x,x)可由下式确定:(x)=Ef(x)(1)k(x,x)=E(f(x)-(x)(f(x)-(x)(2)式中:x,x代表样本中任意随机变量,E代表数学期望。因此GP可定义为:f(x)GP(x),k(x,x)(3)而在实际应
20、用中,通常会进行数据预处理使得均值函数为0,故GP即也表示为:f(x)GP0,k(x,x)(4)对于实际工程中的回归问题,还应考虑输出y受噪声影响:y=f(x)+(5)式中:y是受到噪声污染的观测值,f为函数值,x为输入向量,噪声服从均值为0、方差为2n的高斯分布。26基于指数核函数高斯过程回归的短期径流预测研究 何中政 方丽 刘万 等从而可以推求得到y的先验分布,见公式(6);以及y和f(x*)的联合先验分布,见公式(7)。yN(0,K(X,X)+2nI)(6)yf()x*N0,K()X,X+2nInK()X,x*K()x*,Xk()x*,x*(7)式中:x*为测试输入向量,I是n维单位矩阵
21、,K(X,X)是n n阶的GP协方差矩阵,K(X,x*)是输入集X与测试输入向量x*之间的n 1阶协方差矩阵,K(x*,X)同理可知,k(x*,x*)为x*自身的协方差。由此可知预测值f(x*)的后验分布:f(x*)|X,y,x*N-f(x*),cov(f(x*)(8)其中:-f(x*)=K(x*,X)k(X,X)+2nIn-1y(9)cov(f(x*)=k(x*,x*)-K(x*,X)K(X,X)+2nIn-1K(X,x*)(10)式中:预测均值-f(x*)即为GPR模型的输出,也是观测值y的预测值。1.2高斯过程回归的核函数与超参数优化GPR使用GR作为先验,其训练结果与预先设定的核函数有
22、关。在随机样本均值为0的前提下,核函数就与协方差函数的实际意义相近,可进行样本间相关性的描述。不同核函数作用下的高斯过程回归特征各不相同,高斯过程模型常用的核函数主要有以下几种:(1)径向基核函数:(r)=exp(-r22 2)(11)式中:r=X1-X2,为超参数,表征了学习样本间的相似度。径向基核函数也被称为高斯核,常被应用于SVM和GPR等各类机器学习算法中,参数简单,但在处理样本数量大或特征多时效果一般。(2)二次有理核函数:(r)=(1+r22 l2)-,l 0(12)式中:,l为超参数。二次有理核函数可以理解为是无穷个径向基核函数的线性叠加,当 时,二次有理核函数等价于=l的径向基
23、核函数。与径向基核函数相比,更为省时,作用域广,但是对参数十分敏感。(3)马顿核函数:(r)=21-()(2 rl)K(2 rl),l,0(13)式中:l,为超参数,K为修正贝塞尔函数。当 时,相当于以l为特征尺度的径向基核函数。(4)指数核函数:(r)=exp(-rl)(14)指数核函数是马顿核在=0.5的特殊形式,这样的变动减少对参数的依赖性降低,使得模型的训练学习难度大大降低,适用情景相对狭窄。而核函数中的超参数一般可依据极大似然法,建立基于学习样本条件概率的对数似然函数,见式(15);然后可通过非线性规划方法或群智能搜索方法寻找出超参数的近似最优解。L=lg p(y|X)=-12yT(
24、K)-1y-12lg|K|-n2lg(2)(15)1.3预报因子筛选由于径流预测往往是采用输入多个预测因子对预测量进行输出,研究采用多重相关系数来筛选预报因子。多重相关系数是测量单个因变量与其他多个自变量之间线性相关程度的指标。多重相关系数无法直接计算,可采用预测量y和其他多个预测因子x1,x2,xk线性组合的简单相关系数进行测算。首先,根据预测量y和其他多个预测因子x1,x2,xk进行回归,建立如式(16)的回归方程,然后进一步计算简单相关系数,即为预测量y和多个预测因子x1,x2,xk之间的多重相关系数R。y=0+1x1+2x2+kxk(16)R=()y-y()y-y()y-y2()y-y
25、2(17)式中:0,1,2,k为回归系数。2实例研究2.1研究区域与资料概况赣江是江西省内第一大河流,地理位置为113.58116.63E,24.5228.75N。其发源于赣闽边界武夷山西麓,主河道长约823 km,干支流自南向北贯穿整个江西省,地貌多以山地、丘陵为主,丰水期为3-8月,枯水期为9月-次年2月。图1赣江中下游控制断面分布示意图Fig.1 Distribution diagram of control section in the middle and lower reaches of Ganjiang River27基于指数核函数高斯过程回归的短期径流预测研究 何中政 方丽 刘
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 指数 函数 过程 回归 短期 径流 预测 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。