基于LSTM-SVM模型的河流流量预测.pdf
《基于LSTM-SVM模型的河流流量预测.pdf》由会员分享,可在线阅读,更多相关《基于LSTM-SVM模型的河流流量预测.pdf(8页珍藏版)》请在咨信网上搜索。
1、第43卷第6 期2023年11月doi:10.19638/j.issn1671-1114.20230607天津师范大学学报(自然科学版)Journal of Tianjin Normal University(Natural Science Edition)Vol.43No.6Nov.2023基于 LSTM-SVM 模型的河流流量预测张琴琴1,刘文强,陈之鸿,郝永红2(1.天津师范大学天津市水资源与水环境重点实验室,天津30 0 38 7;2.天津师范大学地理与环境科学学院,天津300387)摘要:基于长短时记忆神经网络(LSTM处理中长期时间序列方面的优势和支持向量机(SVM泛化能力强的特点
2、,提出了一种LSTM-SVM混合模型,并应用于海河流域拒马河逐日流量模拟和预测中,探究该模型的适用性,基于流域内逐日气象数据及水文数据资料,分别利用LSTM和LSTM-SVM构建水文模型,并通过性能评估指标对其进行分析.结果表明:2 种模型在预测河流流量时表现良好,具有可靠性;时间步长为4d时,模型预测结果的精度最高,混合模型效果优于LSTM模型,具体表现在LSTM-SVM模型模拟结果的离散度比LSTM模型小,更具稳定性.因此,LSTM-SVM混合模型在中长期河流流量预测中具有应用潜力。关键词:长短时记忆神经网络;支持向量机;河流流量;预测;拒马河流域中图分类号:K903Forecasting
3、 of river flow based on LSTM-SVM modelZHANG Qinqin,LIU Wenqiang,CHEN Zhihong,HAO Yonghong?(1.Tianjin Key Laboratory of Water Resources and Water Environment,Tianjin Normal University,Tianjin 300387,China;2.School ofGeographic and Environmental Sciences,Tianjin Normal University,Tianjin 300387,China)
4、Abstract:Based on the advantages of long-short-term memory neural network(LSTM)in processing medium and long term-time series and the strong generalization ability of support vector machine(SVM),a hybrid LSTM-SVM model was proposed andapplied to the daily river flow simulation and forecasting of the
5、 Joma River in Haihe River Basin to explore its applicability.LSTM and LSTM-SVM were used to construct hydrological models based on daily meteorological data and hydrological data inthe basin,respectively,and the obtained results were analyzed through performance evaluation indicators.The results sh
6、owedthat:The two models performed well in river flow forecasting and had good reliability;T h e a c c u r a c y o f p r e d i c t i o n r e s u l t swas the highest when the time step was 4 days,and the hybrid model was superior to the LSTM model.Specifically,the sim-ulation results of LSTM-SVM mode
7、l were less discrete and more stable than those of LSTM model.Therefore,the LSTM-SVMhybrid model had application potential in medium and long-term river flow forecasting.Keywords:long-short-term memory neural network;support vector machine;river flow;forecasting;the Joma River文献标志码:A文章编号:16 7 1-1114
8、(2 0 2 3)0 6-0 0 45-0 8我国是水资源短缺的国家之一,经济社会的发展进一步加重了其水资源紧缺的态势叫河流流量精确预测是水文学领域的重要研究内容,特别是在水资源稀缺的地区,预测河流流量有助于水资源的时空规划和分配。然而,由于自然地理要素和人类活动的随机性以及径流形成过程的复杂性,径流表现出高度非线性和非平稳性2-5,这加剧了水文预报研究的困难程度.传统径流预测模型往往基于复杂的物理过程,需要通收稿日期:2 0 2 2-0 6-14基金项目:国家自然科学基金资助项目(42 0 7 2 2 7 7,412 7 2 2 45,40 97 2 16 5).第一作者:张琴琴(1996
9、一),女,硕士研究生.通信作者:郝永红(196 4一),男,教授,主要从事水文地理方面的研究.E-mail:haoyhsxu.edu.过大量参数和复杂的模型校准过程将不确定性降至最低,从而获得高精度的输出.汇流过程的复杂性以及参数计算的不确定性导致同一种模型可能出现不同结果,甚至产生异参同效等问题;同时,基于物理过程的数值模型成本高、时间长,且需要研究人员具备一定程度的模型专业知识和经验,模型的预测效果不理想,以致发展受限8.随着信息技术的不断发展,数据驱动模型近年来 46在水环境与水资源领域取得了广泛的应用.与传统预测模型相比,数据驱动模型的预测性能有所提升.常见的基于机器学习的数据驱动模型
10、包括人工神经网络(A NN)支持向量机(SVM)和随机森林等,基于深度学习的数据驱动模型包括卷积神经网络(CNN)递归神经网络(RNN)和长短时记忆神经网络(LSTM)等9.相关学者利用数据驱动模型做了大量研究,例如Zhang等0 提出了一种ARIMA-ANN混合模型,提高了预测精度;Taghi等利用时间滞后RNN和BP神经网络预测伊朗大坝每日流入量,结果表明2 种模型在预测日常流量时表现良好,但预测洪峰值的精度较低,Wang等2 发现,SVM模型比ANN模型更易解决样本小、非线性和局部最小的问题,且具有良好的泛化能力;Christian等3将优化后的SVM与传统的时间序列模型(SARIMA)
11、进行比较发现,在适当的输入数据条件下,优化后的SVM模型能够提供良好的预测精度.LSTM模型对时间序列数据的预测性能较好I4,例如Ouyang等5运用LSTM模型预测美国境内3557个流域的降雨-径流,结果显示LSTM模型不仅对小流域有很好的模拟效果,对最具挑战的大流域的预测结果也较好在不同使用场景下,LSTM和SVM模型的预测效果不同,主要有3种情形:LSTM预测性能优于SVM6-17,尽管SVM可以提高模型的计算速率,但在处理海量数据和较低河流流量时表现不足,而LSTM具有明显的优势,它可以快速、准确地模拟出不同时间尺度和低人流量情况下的结果,解决了SVM耗时长的问题;2 种模型性能相当,
12、如Han等18 对俄罗斯河流域的径流预测的结果表明,LSTM 和SVM模型在小时径流预测方面性能相当,均优于ANN和基于分布式的物理模型的预测性能,且在丰水期的预测性能优于枯水期;SVM预测效果优于LSTM,Rahimzad等19研究发现,在一些高流量的模拟情况中,SVM的预测效果优于LSTM.本研究基于LSTM模型在处理长周期序列方面的优势以及SVM良好的泛化能力,提出了LSTM-SVM混合模型,分别使用LSTM-SVM模型和LSTM模型预测大清河水系拒马河上游紫荆关水文站的逐日河流流量,比较所得结果,评估LSTM-SVM在河流流量建模中的适用性,为中长期河流流量预测提供参考.1研究方法1.
13、1ILSTM神经网络模型基于人工智能的模型方法(包括人工神经网络和天津师范大学学报(自然科学版)遗传算法)被认为是处理非线性数据的有效方法,然而,它们在处理数据中的依赖关系时存在缺陷2 0-2 1.近年来,RNN因能够学习时间序列数据的内在特征而被应用于水文预报研究中,但由于梯度消失问题,其很难学习到长周期序列间的因果规律2 2 .LSTM 是一种克服了传统RNN长期依赖缺点的特殊RNN,最早由Hochreiter等2 3 提出,并被许多研究人员改进和推广2 1具体结构如图1所示,通过专门设计的门结构(分别为遗忘门、输入门和输出门)和存储单元来确定何时忘记以及保留状态信息.遗忘门输入门个Cta
14、nhhi-1图1LSTM内部结构Fig.1 Structure of LSTM由图1可以看出,LSTM单元共有2 条水平通道:顶部从C-1到C,为单元状态,是LSTM的核心,通过简单的线性操作穿透整个时间序列数据;底部由上一时刻输出的ht-1和当前输入的x,组成另一条通道.模型在t时刻的具体计算公式如下:遗忘门fi=o(Wrhi-1,xi+by)输入门i,=o(W:ht-1,x+b,)C,=tanh(Wc ht-1,xil+bc)单元状态C,=f Ci-I+it Ct输出门0,=o(Wh-1,x)+b.)h,=o,tanh(C,)式中:W,W,以及W。是映射到遗忘门、输人门和输出门的隐藏层的权
15、重值;b,b;及b。为偏置值;C-和C,是上一个时间步长以及下一个时间步长的单元状态;o,表示t时刻的输出;Wc表示单元状态的权重值.1.2SVM模型SVM模型是解决分类和回归问题方面的领先技术之一,且在许多领域表现出色,最早由Vapnik 等2 4提出.SVM能够有效处理数据的非线性和非平稳性,因2023年11月输出门tanhht(1)(2)(3)(4)(5)(6)第43卷第6 期而在水文领域得到了广泛应用2 5.SVM的基本思想是通过一个非线性映射将样本映射到一个高维特征空间,并在该高维特征空间构造出最优分类超平面,最终完成分类预测.假设训练集输入(xi)和目标输出(yi,其中iR,则目标
16、函数为y=f(x)=wb()+b式中:y是预测值;w和b是函数的参数向量;()表示非线性变换函数.通过解决以下优化问题来估计参数的最佳值:min I l+cZ(si-5t)2(y预测值-y)8+5(5i,50式中:C为惩罚系数,它表示权重分散和目标函数之间的权衡2 6 ;si、$为松弛变量,表示样本的离群程度;8为不敏感损失函数.通过在对偶空间中引入拉格朗日乘子a;和,最终可得到如下决策函数(x)=Z(-i)K(xi,x,)+bi=1式中:K(xi,x)为核函数,本研究采用线性核函数,它具有参数少、速度快的优点,表达式为K(xi,x,)=xixj1.3LSTM-SVM模型根据当前LSTM计算量
17、大、耗时长等不足以及SVM速度快、分类能力强等优势,本研究提出一种LSTM-SVM混合模型,模型框架如图2 所示.老LSTM,LSTM,LSTM,LSTM,LSTM2LSTMiLSTM全连接层SVM分类器图2 LSTM-SVM模型框架Fig.2Prediction framework of LSTM-SVM张琴琴,等:基于LSTM-SVM模型的河流流量预测(7)1(8)(9)(10)(11)LSTM,LSTM,47由图2 可以看出,本研究预测模型包含数据输人、LSTM模型及SVM3个部分.第一阶段:给定输人序列X=(x 1,x 2,x n),主要包含降水、水位和水温3个水文要素及气温、气压、相
18、对湿度、日照和风速5个气象要素.第二阶段:将数据提供给LSTM层,通过3层LSTM堆叠对数据进行深度挖掘.从而确定后续单元需要保留的信息.LSTM包含1个tanh层和3个sigmoid函数.每层LSTM都与其他层相互作用,主要连接上一层数据的输入以及当前数据的输出.第三阶段:修改LSTM网络的softmax层,在softmax层使用SVM分类器进行预测并直接输出预测值,进一步提升预测结果的准确性.LSTM-SVM模型的逻辑流程图如图3所示.由图3可以看出,预测过程先对数据进行标准化处理,消除指标之间的量纲影响,再将数据集划分为7 0%的训练集和30%的预测集;然后将LSTM和SVM分类器进行组
19、合,原始数据集通过LSTM模型的记忆单元和遗忘门机制,将深度特征提取的数据输入给SVM;最后对组合模型进行数据训练并做预测,评估模型误差,当预测结果未达到模型评估标准时,重新调节参数,直至达到标准,输出序列,完成预测.多源数据输人气象数据水文数据标准化处理划分数据集训练集预测集LSTM-SVM模型输入参数的选取LSTM层1特征提取LSTM层2重新调节参数LSTM层3SVM模型训练数据预测数据是否符合要求输出序列(模拟值)图3LSTM-SVM逻辑流程图Fig.3Logic flow chart of LSTM-SVM481.4模型评价指标为了评估模型的性能和准确性,本研究使用公式(12)一(15
20、)作为评估标准.平均绝对误差(MAE)和均方误差(RMSE)越接近O,模型的性能越好;Nash-Sutcliffe模型的效率系数(NSE)和决定系数(R)越接近1,模型的性能越好.MAE=2x;-ylni=11RMSE一NSE=1-二i=12(x-5.)2R?=1-i=1i=1式中:x;为观测值;x为观测序列的均值;y;为模型的预测值;.为统计模型的变量模拟值;n为样本数.参考文献2 7-2 8 ,模型性能评级标准如表1所示.表1模型的性能评级Tab.1Performance ratings of model性能评级非常好良好符合要求不符合要求2石研究区概况与数据来源2.1研究区概况拒马河是海
21、河流域大清河水系北支的主要河流,发源于河北省涞源县西北太行山麓,流经河北省易县、涞水县,至北京张坊分为南拒马河和北拒马河.北拒马河流经河北涿州、高碑店,在白沟镇与南拒马河汇合后称为大清河,最后流入天津海河,全长2 38 km,流域面积49 38 km,如图4所示.拒马河为重要的水源地,对下游白洋淀生态湿地和雄安新区有重要的水源供给和生态屏障作用.紫荆关水文站(北纬392 6 ,东经11510)位于易县的紫荆关镇,是拒马河上游唯一的重要河道控制站,控制流域面积17 6 0 km229.流域内植被情况较差,水土流失严重,属温带半干旱大陆性季风气候,夏季炎热多雨,冬季寒冷干燥,汛期雨天津师范大学学报
22、(自然科学版)水暴涨暴落,水位流量较不稳定.114E40NF(12)39N(13)-Xn=110.75R1.000.65R20.750.50 R0.65R?0.502023年11月115E116E保定高程值/m2.775849-55地市大清河流域河流0.1020406080mokm(14)图4研究区域位置示意图Fig.4Location of the studied area2.2数据来源及模型参数2.2.1数据来源(15)本研究中紫荆关水文站数据来源于中华人民共和国水文年鉴海河流域水文资料中华人民共和国水利部水文局刊印),包括逐日平均流量、水温、降水量和平均水位;研究流域上游无相应气象站,故
23、选取与水文站点距离最近的气象数据为研究资料,数据来源于中国科学院地理科学与资源研究所的国家级地面气象观测站易县气象站(站号5450 7)日值数据集,R2NSE0.75NSE1.000.65NSE0.750.50NSE0.65NSE0.50117E图例紫荆关水文站气象站点包含5项气象数据.以水温、降水、水位、气温、气压、相对湿度、日照、风速作为模型的输人变量,河流流量的预测值作为模型的输出量.由于洪水水文要素在一年中出现的次数较少,连续年间存在间断,故以小时为单位的数据存在不连续的现象,基于此,选用日尺度的水文时间序列数据进行水文模型的河流流量预测.数据长度为2 0 0 6 年1月1日一2 0
24、19 年12 月31日,其中2 0 0 6 年1月1日一2 0 15年9月30 日为训练期,2 0 15年10 月1日一2 0 19 年12 月31日为预测期.针对少量监测数据缺失的问题,取每年该月份的平均值进行填补,水文和气候资料如图5所示.2.2.2模型参数LSTM-SVM模型在LSTM部分的主要参数及参数值为:神经元数(32)、优化器(adam)、批量大小(6 4)迭代次数(12 0 0)、损失函数(mse)和随机丢弃值(0.5).模型在SVM部分需要率定的主要参数为:模型结束标准的精度(tol)惩罚系数(C值)和损失函数().C 值越大,对模型的的惩罚力度也越大,模型的精度更高但容易出
25、现过拟合;8 值越大表明模型容错越多,越易发生欠拟合9.本研究中当 tol=10.1,C=16.1,8=0.1时,模型在预测集上的表现最好.第43卷第6 期张琴琴,等:基于LSTM-SVM模型的河流流量预测49(-s.u I0)/区%10440斤18260100809990D.I0/可420280140W/u/为验证LSTM-SVM模型预测河流流量的优点,分别使用LSTM-SVM模型和LSTM模型对流量进行模拟,并对比分析模拟结果.为了便于比较,LSTM模型的构建与LSTM-SVM模型中的LSTM模块一致.年份(a)风速685013584563结果与分析由于水文气象因素对河流流量的影响具有一定
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 LSTM SVM 模型 河流 流量 预测
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。