VMD-PSO-LSTM模型的日径流多步预测.pdf
《VMD-PSO-LSTM模型的日径流多步预测.pdf》由会员分享,可在线阅读,更多相关《VMD-PSO-LSTM模型的日径流多步预测.pdf(10页珍藏版)》请在咨信网上搜索。
1、DOI:10.12170/20220208001王秀杰,王玲,滕振敏,等.VMD-PSO-LSTM 模型的日径流多步预测 J.水利水运工程学报,2023(4):81-90.(WANG Xiujie,WANG Ling,TENG Zhenmin,et al.Research on multi-step forecast of daily runoff based on VMD-PSO-LSTM modelJ.Hydro-Science and Engineering,2023(4):81-90.(in Chinese)VMD-PSO-LSTM 模型的日径流多步预测王秀杰1,王 玲1,滕振敏2,田
2、福昌1,袁佩贤3,苑希民1(1.天津大学 水利工程仿真与安全国家重点实验室,天津 300072;2.崇左市左江治旱工程管理中心,广西 崇左532200;3.北京城建设计发展集团股份有限公司,北京 100032)摘要:为了弱化径流时间序列的非线性和非平稳性,提高不同预见期的日径流预测精度,提出了一种新的VMD-PSO-LSTM 多步预测组合模型。首先采用变分模态分解(VMD)方法将原始日径流序列分解为子序列,通过粒子群优化算法(PSO)对长短期记忆(LSTM)模型参数进行优化,对各子序列建立 PSO-LSTM 模型,各分量的预测值重构集成预测结果。将 VMD-PSO-LSTM 模型应用于黄河下游
3、花园口和利津站的日径流多步预测,采用 Nash sutcliffe 效率系数(ENS)、相关系数(R)和均方根误差(ERMS)3 个定量评价指标对模型预测结果进行评价。结果表明:在预见期为 1、2、3 d 的情况下,两个测站的 Nash sutcliffe 效率系数和相关系数均在 0.90 以上。与 CEEMD-PSO-LSTM 和 PSO-LSTM 模型的预测结果对比表明,该模型能够有效提高日径流多步预测精度,是一种高效稳定的径流预报模型。关键词:非平稳序列;日径流多步预测;长短期记忆模型;变分模态分解方法中图分类号:TV124 文献标志码:A 文章编号:1009-640X(2023)04-
4、0081-10 准确可靠的径流预测对合理利用水资源、提升防洪减灾能力及充分发挥水库的综合效益具有重要意义。但受气候变化和人类活动等因素的综合影响,径流变化具有较强的非线性和不确定性,为水文预报带来困难。因此,提高水文预报精度一直是水文水资源领域的研究重点和难点。目前,常用的基于数据驱动的径流预测方法有线性预测模型和机器学习模型。线性预测模型基于线性回归理论,结构简单,难以应对复杂非平稳的径流信息1。机器学习的发展为复杂径流的预测提供了新思路,其中传统浅层的机器学习方法虽然能够成功进行复杂非平稳的径流预测,但其精度仍需进一步改进2。随着人工智能技术的不断发展,深度学习被引入预测领域。其中长短期记
5、忆(LSTM)模型具有较强的非线性预测能力、较快的收敛速度和捕捉时间序列长期相关性的能力,是一种具有特殊门控设计的循环神经网络(RNN),可以长时间保留历史有用信息3,已有研究4-5证明了其在径流预测中的优势。虽然机器学习模型在水文预报领域已经取得了丰硕成果,但传统单一的神经网络模型学习过程易产生局部最优和过拟合问题6。为解决此问题,一些学者采用自适应调节人工蚁群(ARACS)、灰狼优化算法(GWO)、PSO 等算法优化神经网络参数,如白继中等7提出的自适应调节人工蚁群-径向基函数神经网络混合预测模型(ARACS-RBF),径流预测效果明显优于RBF 模型;王立辉等 8提出灰狼优化的长短期记忆
6、模型(GWO-LSTM),将其应用于径流预测,结果表明泛化性能较好;郑恺原等9提出的粒子群算法-加权随机森林模型(PSO-WRF),与 WRF 模型相比,PSO-收稿日期:2022-02-08基金项目:国家重点研发计划资助项目(2018YFC1508403);科技部重点领域创新团队项目(2014RA031);国家自然科学基金委创新团队项目(51621092)作者简介:王秀杰(1973),女,辽宁葫芦岛人,副教授,博士,主要从事水文系统预测与模拟研究。E-mail: 通信作者:田福昌(E-mail:)第 4 期水利水运工程学报No.42023 年 8 月HYDRO-SCIENCE AND ENG
7、INEERINGAug.2023WRF 模型优化效果显著,具有良好的预测精度和泛化能力。由于径流序列高度的非线性与非稳定性,使得运用单一模型对径流序列进行预测,难以完全捕捉径流序列中的非线性因素。利用适当的时频信号分解技术分解原始水文时间序列建立集成模型,可有效提取水文时间序列中的有效信息,提高时间序列的平稳性和可预报性,从而提高模型的预报精度。许多学者对“分解-预测-重构”的组合预测模型进行了大量研究。周婷等10提出了小波分解-支持向量机-PSO 算法(WD-SVM-PSO)混合预测模型,基于淮河流域响洪甸水库 19592014 年径流过程进行年径流预测,验证了时间序列分解预处理的有效性;孙
8、娜等11提出了一种将 EEMD、样本熵(SE)和正则化极限学习机(RELM)相结合的非平稳日径流预测方法(ES-RELM),基于金沙江下游控制站屏山站 20002010 年的日径流实测数据进行日径流预测,表明分解后的模型预测精度更高;王文川等12采用具有自适应序列特征的时变滤波经验模态分解(TVF-EMD)与 LSTM 耦合,构成 TVF-EMD-LSTM 预测模型进行洛河流域长水水文站月径流预测;黄景光等13提出一种小波分析-支持向量机(WD-SVM)特征分类组合预测模型,基于宜昌站 20132017 年日径流序列进行预测,结果表明相对于单一模型,新模型预测精度和稳定性明显提高;He 等14
9、建立了变分模态分解(VMD)-深度神经网络(DNN)混合预测模型预报水库径流,预测性能优于 EMD-DNN 和EEMD-DNN 等模型。小波分解需要根据经验预先设定母波函数及分解层数,受人为影响大;EMD、EEMD则可根据时间序列的局部特征自适应将序列分解为一系列固有模态分量,与 WT 相比更具有普适性,但是容易存在伪分量和模态混叠问题,制约了预测精度的提高;VMD 是一种自适应维纳滤波器组,相比 EMD 的递归筛选模式,VMD 是一种完全非递归的变分模态分解,能减少伪分量和模态混叠,并具有比 EMD 和EEMD 更好的噪声鲁棒性15,是分解复杂非线性非平稳时间序列的一种有效手段。从以上研究可
10、以看出,目前径流预测研究多是单步预测,利用“分解-预测-重构”方法对日径流多步预测的研究并不多见,而考虑不同预见期的径流预测模型能够对流域的防洪减灾起到更好的预防警示作用。常用的多步预测方法包括递推多步预测和直接多步预测。递归多步预测通过单步预测模型多次迭代来实现,将存在误差的单步预测输出作为下一步预测的输入,因此,随着多步预测的推进,预测误差不断放大,且在滞后较大的动态非线性系统中误差更为显著。而直接多步预测,根据模型直接得到多步预测值,不存在误差传播的问题,预测精度较高。如 Atiya 等16对比了递推多步预测和直接多步预测的预测效果,结果表明直接多步预测比递推多步预测的预测效果更好、精度
11、更高。综合以上各研究方法的优势,本文将 VMD 分解方法与 LSTM 结合,并基于 PSO 算法优化 LSTM 模型参数,进行不同预见期下的日径流直接多步预测研究。1 研究方法 1.11.1变分模态分解(VMD)VMD 是一种自适应、非递归的变分模态信号分解方法,其自适应性体现在可以根据输入信号的特性确定所给序列的模态分解个数 k,并匹配每种模态的最佳中心频率和有限带宽,以便平衡处理序列各部分存在的噪声17。VMD 的目标是将一个原始输入信号分解成一组离散的具有特殊稀疏性的子信号(模态),在保证分解序列各模态的带宽之和最小的前提下,所有模态之和与原始输入信号相等,对模态函数进行希尔伯特(Hil
12、bert)变换并进行变分约束,表达式如下:minuk,wkk?t(t)+jt)uk(t)ejwkt?22使kuk=f(1)(t)式中:uk和wk分别为原信号分解得到的所有模态及其中心频率的集合;t 为时间变量;为狄拉克函数;82水 利 水 运 工 程 学 报2023 年 8 月uk(t)f(t)+jt)uk(t)uk(t)为分解序列模态调幅调频(AM-FM)信号;为径流序列;是的希尔伯特变换结果。对式(1)进行重构,同时引入拉格朗日系数,转化为非约束变分问题,扩展的拉格朗日表达式为:L(uk,wk,)=k?t(t)+jt)uk(t)ejwkt?2+?f(t)kuk(t)?22+(t),f(t)
13、kuk(t)(2)ukwk式中:为拉格朗日乘子;为惩罚因子。将上述拉格朗日函数进行时-频域变换,并进行相应的极值求解,即可得到模态分量及中心频率的频域表达式:un+1k(w)=f(w)i,k ui(w)+(w)21+2(wwk)2(3)wn+1k=w0w|uk(w)|2dww0|uk(w)|2dw(4)un+1k(w)f(w)i,k ui(w)wn+1k uk(w)uk(t)ukwk式中:相当于当前剩余量的维纳滤波;为当前模态函数功率谱的重心,对进行傅里叶逆变换,实部则为。最后,在迭代子优化序列中运用乘子交替方向法(ADMM),不断更新和得到最优解,进而求解分解层数 k 与各模态分量。1.21
14、.2长短期记忆网络(LSTM)LSTM 神经网络是一种特殊的 RNN 网络,LSTM 通过其独特的门控设计,克服了传统 RNN 学习长期依赖关系的问题,适合于处理和预测时间序列中间隔和延迟非常长的重要事件18。在原始 RNN 中,只有一种内部状态 ht,对于短期序列的输入比较敏感,LSTM 的循环单元更为复杂,与 RNN 简单的 tanh 层相比,其拥有 4 个相互交替的网络层,如图 1 所示。遗忘门AA1ht1ht+1Xt+1Xt1ht1Ct1+tanhtanhXtOtitCtfthtCtht23输入门输出门图 1 LSTM 网络结构Fig.1 LSTM network structure
15、diagram LSTM 每一个循环单元都有一个新增的单元状态 C,将前期输入信息长期保留,这是 LSTM 更适用于长期序列的原因。在 t 时刻,网络的输入包括 t-1 时刻的输出值 ht-1、t 时刻的输入值及 t-1 时刻的单元状态Ct-1;网络的输出包括 t 时刻的单元状态 Ct和输出值 ht。LSTM 的关键是对长期状态 C 的控制,LSTM 的神经网络模块使用了一种“门”(gate)结构,包括:输入门、遗忘门和输出门。输入门可将前序单元的信息输入到长期状态 C 中长期保留;遗忘门控制前一状态Ct-1中被遗忘的元素;输出门控制长期状态 C 在 t 时刻 LSTM 模块中的输出。第 4
16、期王秀杰,等:VMD-PSO-LSTM 模型的日径流多步预测83ft 1.2.1遗 忘 门遗忘门 通过读取上一时刻输出值 ht1及当前时刻输入值 xt,输出 0 到 1 之间的数值用于决定上一时刻单元状态 Ct1中信息保留比重。1 表示完全保留,0 表示完全舍弃。计算式如下:ft=(Wfht1xt+bf)(5)ftWfht1xt式中:为遗忘门的输出;为 sigmoid 函数;为遗忘门的权重;为上一时刻输出值;为当前时刻输入值;bf为遗忘门的偏置项。CtCt 1.2.2输 入 门输入门 it确定了当前输入的单元状态中用于更新当前时间步的最终单元状态 Ct的信息。其中,是由上一时刻输出 ht1和当
17、前时刻输入 xt计算得出的当前输入下的单元状态信息,Ct取值范围为(1,1),it取值范围为(0,1),计算式如下:it=(Wiht1xt+bi)(6)Ct=tanh(W cht1xt+b c)(7)Ct=ftCt1+itCt(8)itWiW cCtb cCtCt1式中:为输入门的输出;为输入门的权重矩阵;bi为输入门的偏置项;为单元状态的权重矩阵;为单元状态的偏置项;Ct为当前时刻的单元状态;为上一时刻的单元状态。1.2.3输 出 门输出门 ot决定了 Ct中用于作为当前时刻输出 ht的信息。Ct经过 tanh 层处理,得到(1,1)之间的值。ot和 ht的计算式如下:ot=(Woht1xt
18、+bo)(9)ht=ottanh(Ct)(10)otWoht式中:为输出门的输出;为输出门的权重矩阵;bo为输出门的偏置项;为当前时刻输出值。另外,本文采用 PSO 算法优化 LSTM 模型中隐含层节点数和学习率两个参数。PSO 是一种群体协作的随机搜索算法,通过不断迭代计算,协调粒子自身和群体的最优值对粒子当前运动方向和运动速度的影响,全局极值不断更新来找出问题的最优解。具体原理见文献 19,这里不再赘述。1.31.3VMD-PSO-LSTM 径流预测模型VMD-PSO-LSTM 径流预测模型综合了 VMD 分解方法自适应、完全非递归的特性及 PSO-LSTM 神经网络参数自动寻优、长期数据
19、记忆的优势。模型的建立包含以下 4 个步骤:步骤 1:VMD 序列分解。使用 VMD 算法将原始径流序列分解成 k 个离散的固有模态分量(SIMF),使非平稳原序列分解得到多个较稳定的子序列。VMD 分解效率和预测精度主要受分解层数 k 和惩罚因子等参数的影响,VMD 分解虽具有较好的分解效果,但存在确定分解层数 k 的不确定性问题,因此本文采用排列熵优化算法(permutation entroy optimization,PEO)实现分解层数 k 的自适应确定。该算法具体步骤参考相关文献20。步骤 2:PSO 参数优化。利用 PSO 算法对 LSTM 网络的参数进行优化,使得网络隐含层节点数
20、(NHN)和学习率()达到最优。步骤 3:LSTM 网络训练。在参数优化的基础上建立预测模型,使用步骤 2 得到的最优参数建立LSTM 网络,对每个子序列进行 LSTM 网络训练。在训练之前需将分解后的各 SIMF进行归一化处理(由于径流序列具有高度非线性和非平稳性,因此必须对输入数据进行归一化处理,以避免训练过程中数据出现大的波动)。其中,直接多步预测在模型中以滑动窗口机制实现,假定一段径流时间序列为 X=x1,x2,xn,模型输入步长为 L,即滑动窗口的当前窗口长度为 L;滑动窗口的移动步长为 1;当预测预见期为 a(本文预见期设84水 利 水 运 工 程 学 报2023 年 8 月为 1
21、、2、3 d)时,当前 t 时刻向后预测 a 天的直接多步预测模型输入输出结构如图 2 所示。步骤 4:序列预测。利用 PACF 偏自相关分析法确定的输入变量,在训练好的 LSTM 网络的基础上对每个子序列进行预测,各 SIMF预测值叠加即为最终预测结果。2 实例分析本文采用黄河下游花园口和利津站 20032012 年的逐日径流资料作为研究数据(数据均来源于黄河水利委员会),以 20032009 年的日径流序列为训练数据,20102012 年的日径流序列为验证数据。花园口和利津站的日径流序列过程见图 3。VMD 分解方法具有自适应性和强大的降噪性能,针对径流序列的非平稳性,将频率不同且成分复杂
22、的径流时间序列分解成具有固有模态函数的平稳性序列分量 SIMF,采用 VMD 法分别对花园口和利津站的日径流序列进行分解,经过排列熵算法,自适应得到最优 k 值,从而获取 k 个序列分量。花园口和利津站的日径流序列经分解得到的子序列个数分别为 6 和 8 个。参考相关文献15,21,本文模型惩罚因子取 2 000。以花园口站为例,研究数据的分解结果如图 4 所示,可以看出,通过 VMD 分解,将原始日径流序列分为了由高频到低频的周期性模态分量与表示趋势的残差,揭示出日径流数据内的隐藏信息,即周期性震荡变化和趋势。这样不仅使模型能更好地理解周期性的信息,同时也有利于提高模型的训练和预测精度。对于
23、上述每个 SIMF分别建立 PSO-LSTM 预测模型,各子序列预测结果的叠加即原径流序列的预测结果。其中模型的输入步长利用偏自相关函数(PACF)来确定,可突出时间滞后对当前时段径流的影响。假设输出变量为 xi,当滞后 L 的偏自相关系数 fPACF超出 95%置信区间时,前 L 个变量即为输入变量22。以花园口站为例,原始日径流序列经过 VMD 分解得到 6 个子序列,由 PACF 计算得到各 SIMF的输入步长分别为 1、6、4、4、8、11,如图 5。具体的输入步长及输入变量如表 1 所示。LSTM 网络隐含层节点数(NHN)和学习率()利用 PSO 算法确定,隐含层数为 2 层。以花
24、园口站为例,每个 SIMF在 13 d 预见期对应的最优NHN 和 值见表 2。模型的输入层节点数等于输入变量数,输出层节点数为 1。将当前时段 t 之前的数据作为模型的输入,分别将 t 时刻、t+1 时刻、t+2 时刻的预测数据作为输出构建预测模型,实现预见期 13 d 的多步预测。输入输出t=Kt=K+1t=K+2xK LxK 2xK 1xK 1xKxKxK+1xK L+1xK L+1xK L+2xK+a 1xK+axK+a+1xK L+2xK L+3 图 2 直接多步预测示意Fig.2 Schematic diagram of direct multi-step prediction 0
25、500 1 000 1 500时间/d利津花园口2 000 2 500 3 000 3 500 4 0001 0002 0003 000日径流/(m3s1)4 0005 000训练数据验证数据 图 3 花园口和利津站的日径流序列Fig.3 The daily runoff sequence at Huayuankouand Lijin Stations 第 4 期王秀杰,等:VMD-PSO-LSTM 模型的日径流多步预测85 表 1 花园口和利津站各SIMF的输入步长及输入变量Tab.1 Input steps and input variables of each SIMF at Huayu
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- VMD PSO LSTM 模型 径流 预测
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。