改进PSO的SVM回归模型及在气温预测中的应用.pdf
《改进PSO的SVM回归模型及在气温预测中的应用.pdf》由会员分享,可在线阅读,更多相关《改进PSO的SVM回归模型及在气温预测中的应用.pdf(8页珍藏版)》请在咨信网上搜索。
1、改进 PSO 的 SVM 回归模型及在气温预测中的应用刘洋1,张鸿1,徐娟1,任余龙2,唐建新31(甘肃省气象信息与技术装备保障中心,兰州730020)2(中国气象局兰州干旱气象研究所甘肃省防灾减灾重点实验室,兰州730020)3(兰州理工大学计算机与通信学院,兰州730050)通信作者:张鸿,E-mail:摘要:兰州市气温是一个非平稳序列,具有典型噪声大、不稳定的特征,气温变化越大,越不稳定.为了能够提高支持向量机在气温预测中的预测精度、强化泛化能力和降低参数选择的灵敏度.本文提出了改进的粒子群算法(improvedparticleswarmoptimization,IPSO)优化支持向量机
2、(supportvectormachine,SVM)的气温预测模型.首先在粒子群算法(particleswarmoptimization,PSO)中引入了自适应惯性权重以提高 PSO 算法的全局寻优能力和局部开发能力,其次利用改进的 IPSO 算法优化 SVM 的惩罚因子和核函数参数,将优化后的模型(IPSO-SVM)应用于气温预测中.以兰州地面观测站点实际数据作为样本数据,运用 Matlab 实验工具进行训练和预测,实验结果表明,本文 IPSO-SVM 模型相比于 BP,SVM,GRID-SVM,GWO-SVM,ABC-SVM,ACO-SVM 模型具有更强的泛化能力,更好的拟合度,可以更加准
3、确地预测气温的变化,进一步验证了该模型在气温预测方面的可行性.关键词:粒子群算法;支持向量机;气温;优化;预测引用格式:刘洋,张鸿,徐娟,任余龙,唐建新.改进 PSO 的 SVM 回归模型及在气温预测中的应用.计算机系统应用,2023,32(9):203210.http:/www.c-s- PSO SVM Regression Model and Its Application in Temperature PredictionLIUYang1,ZHANGHong1,XUJuan1,RENYu-Long2,TANGJian-Xin31(GansuMeteorologicalInformatio
4、nandEquipmentTechnicalSupportCenter,Lanzhou730020,China)2(KeyLaboratoryofAridClimaticChangeandReducingDisasterofGansuProvince,InstituteofAridMeteorology,ChinaMeterologicalAdministration,Lanzhou730020,China)3(CollegeofComputerandCommunication,LanzhouUniversityofTechnology,Lanzhou730050,China)Abstract
5、:ThetemperatureofLanzhouCityisanon-stationarysequencewithtypicalcharacteristicsofloudnoiseandinstability.Asthetemperaturechangesgreatly,thesequencegetsunstable.Inordertoimprovethepredictionaccuracy,strengthenthegeneralizationability,andreducethesensitivityofparameterselectionofsupportvectormachine(S
6、VM)intemperatureprediction,inthisstudy,theimprovedparticleswarmoptimization(IPSO)algorithmisproposedtooptimizethetemperaturepredictionmodelofSVM.Firstly,theadaptiveinertiaweightisintroducedintotheparticleswarmoptimization(PSO)algorithmtoimprovetheglobaloptimizationabilityandlocaldevelopmentabilityof
7、thePSOalgorithm.Secondly,theimprovedIPSOisusedtooptimizethepenaltyfactorandkernelfunctionparameteroftheSVM,andtheoptimizedmodel(IPSO-SVM)isappliedtothetemperatureprediction.TheactualdataofLanzhougroundobservationstationaretakenassampledata,andMatlabexperimentaltoolsareusedfortrainingandprediction.Th
8、eexperimentalresultsshowthattheIPSO-SVMmodelinthisstudyhasastrongergeneralizationabilityandbetterfitting计算机系统应用ISSN1003-3254,CODENCSAOBNE-mail:ComputerSystems&Applications,2023,32(9):203210doi:10.15888/ki.csa.009225http:/www.c-s-中国科学院软件研究所版权所有.Tel:+86-10-62661041基金项目:国家自然科学基金(62162040);国家电网公司总部科技项目(
9、SGHE000KXJS1700074);2022 年甘肃省气象信息与技术装备保障中心科技创新基金(202201)收稿时间:2022-12-20;修改时间:2023-03-01;采用时间:2023-04-07;csa 在线出版时间:2023-07-14CNKI 网络首发时间:2023-07-17ResearchandDevelopment研究开发203degreethanbackpropagation(BP),SVM,GRID-SVM,GWO-SVM,ABC-SVM,andACO-SVM.Itcanpredictthechangeintemperaturesmoreaccurately,whic
10、hfurtherverifiesthefeasibilityofthismodelintemperatureprediction.Key words:particleswarmoptimization(PSO);supportvectormachine(SVM);temperature;optimization;prediction天气现象与人们日常生活和各行各业息息相关,气象变化极为不稳定,容易受到各种气象因素的制约和相互影响,这使得天气现象的演化成为一个复杂多变,包含多种无法控制因素的过程,因此能够准确地预测气象要素一直充满着挑战13.随着互联网技术、信息化技术以及气象观测技术的迅速发展,
11、气象地面观测站点不断增多,观测频次从逐天逐时转变为逐分钟,同时天气雷达和气象卫星的发射使得高空层面的数据越来越多,气象数据的快速增长使得气象行业累积了海量的数据,气象行业数据多种多样,包括各类结构化、半结构化和非结构化数据,数据量已达到 PB 以上,具有典型的大数据特征4.传统的气象预报模型是在各种基本假设成立的条件下完成的,基本假设决定了预报的准确率,当大量的基本假设不成立时,预测模型的效果将会很差,同时传统预报模型的另外一个缺点就是运算量非常大5.随着气象大数据的到来,我们可以利用巨大的气象数据集,分析不同气象要素之间的关联关系,降低预测模型中的基本假设,利用数据驱动模型进行天气现象的预测
12、.目前,该模型已被广泛应用于各类气象要素的预测中6,7.支持向量机(supportvectormachine,SVM)算法是一种通用的机器学习方法,它在小样本数据情况下求解速度快,预测精度高,能够避免过拟合、高维度等问题,由于该算法在非线性和高维度的复杂系统预测中表现出了许多特有的优势,因此被广泛使用,主要用途是分类和回归模型分析.目前,已被应用到人脸识别、邮件分类、故障诊断、各类预测等相关领域810.支持向量机算法主要是通过核函数进行计算,该算法对核函数和相关参数的初始化设置非常敏感,参数的不同设置会对最终的预测结果产生极大的影响,因此合适的参数选择一直是 SVM 研究的难点.群体智能优化算
13、法在参数寻优方面具有较强的并行处理能力,能够平衡全局与局部搜索,寻优速度快,效果良好11.朱晶晶等人12利用 19702014 年海南省全部市县的月平均资料,构建了 SVM 回归预测模型,实现了对气温的预测,结果表明 SVM 算法在气温短期预测中具有很好的效果.杨通晓等人13构建了 SVM 的雷达降水类型识别模型,是 SVM 分类模型的一种应用.在 SVM 中核函数采用径向基函数,同时利用 PSO 对核函数参数进行寻优,结果显示该方法有效地提高了雷达对流天气下降水类型的识别精度.晋健等人14为提升中长期预报的预测精度,以均方差作为目标函数构建了 FA-SVM中长期径流预报模型,结果验证了 FA
14、-SVM 模型的预测效果优于基本的 BP 神经网络模型.李纯斌等人15选取了甘肃省作为研究对象,利用 BP 神经网络和 SVM模型构建了降水量空间插值模型,结果显示 SVM 的插值精度模型明显地高于 BP 神经网络模型.史旭明等人16以桂林市 13 个站点 24h 降水量为研究对象,建立了改进的单站降水 SVM 回归集合预报模型,与 ECMWF模式降水预报相比,该模型的预报精度显著提高.目前,利用群体智能算法对 SVM 相关参数进行寻优时,由于群体智能算法自身的缺陷导致 SVM 出现过拟合、泛化能力差、容易陷入局部最优等问题.针对上述问题,本文从预测模型的参数优化方面进行了研究,提出了一种改进
15、 PSO 算法优化 SVM 的气温预测模型,SVM 中两个参数的设置对预测模型影响很大,由于粒子群算法在后期寻优的过程中种群的多样性降低,容易陷入局部最优等问题,需要对 PSO算法进行改进,本文采用了自适应的惯性权重,提高了该算法的全局搜索能力和寻优效率,利用改进后的 IPSO算法对气温预测模型 SVM 进行寻优,实现了模型的优化选择,使得预测精度进一步提高.1IPSO-SVM 算法 1.1 支持向量机回归支持向量机出现在 20 世纪 90 年代,是一种优秀的机器学习方法17,其基本思想是支持向量回归(supportvectorregression,SVR)将原始输入数据的空间映射到高维的特征
16、空间上,实现了升维,将原始空间中的非线性回归问题进一步线性化,通过引入非线性的核函数来实现,即定义一个最优线性超平面,把寻找最优超平面的问题转化为一个求解最优解的问题,使得期望值计 算 机 系 统 应 用http:/www.c-s-2023年第32卷第9期204研究开发ResearchandDevelopment最小.因此,在特征空间中,只需构造特征空间最优线性回归超平面.如式(1)所示:f(x)=wTx+u(1)其中,x 表示样本集,w 表示最优超平面的法向量.|w|2f(x)f(x)f(x)为了使得间隔最大化,通过最小化寻找最优函数,对于每个训练数据能够容忍与 y 之间最多有 的误差,为了
17、能够允许异常值,仅当与 y 之差的绝对值大于 时才计算损失,大于 的数据通过敏感损失函数来惩罚,对每个约束条件加入拉格朗日乘子得到其对偶问题的显式表达,从而得到不等式约束的优化问题,该问题的优化需要满足 KKT 条件,通过计算最佳权重的偏差,利用方程输出预测值,其最优化目标函数如式(2)和式(3)所示18,19:f(xnew)=u+ni(aiai)(xnew,xi)(2)u=yi+mnew=1(anewanew)xTnewxi(3)xnewxiaiai(xnew,xi)yi式(2)中,表示 x 中的支持向量.n 表示支持向量的总个数,为拉格朗日乘子,表示核函数;式(3)中 为预测值,为不敏感系
18、数.1.2 粒子群优化算法粒子群算法是由 Kennedy 等人在 1995 年提出20,该算法来源于自然界对鸟群捕食行为的模拟,在问题对应的解空间中有多个不同的食物源,而最大的食物源只有一个,最大的食物源可以类比为解空间的全局最优解,剩余的食物源可以类比为解空间的局部最优解,鸟群的任务就是找到全局最优解,在整个群体寻优的过程中,利用群体中的个体相互传递和共享位置信息实现整个种群向最大食物源不断靠拢,从而找到全局最优解.在 PSO 中,解空间的每一个解向量称为粒子,每个粒子都具有两个属性,即位置向量和速度向量,位置向量用来计算当前粒子所处位置的适应度值,该适应度值表示当前粒子的位置到全局最优解的
19、距离.速度向量决定了粒子下次飞行的方向和速度.在每次寻优的过程中,种群中的粒子可以根据自身的经验和种群中最优的粒子不断变换自己的飞行方向和速度,从而使得整个种群向全局最优解靠近.PSO 算法步骤如下.(1)种群初始化.包括种群的大小,初始粒子的位置和速度,并计算每个粒子的适应度值,确定个体最优粒子和全局最优粒子.假设在一个 D 维搜索空间中,有 N 个粒子组成一个群落,其中第i个粒子表示为一个D维向量.如式(4)所示:Xi=(xi1,xi2,xiD,),i=1,2,N(4)第 i 个粒子的速度如式(5)所示:Vi=(vi1,vi2,viD,),i=1,2,N(5)pbestgbest同时记录每
20、个粒子的最优解和整个种群的最优解.(2)更新每个粒子自己的速度和位置,并计算适应度值.如果每个粒子的适应度值优于历史的适应度值,更新粒子的位置和适应度值.如果整个种群中最优适应度值优于当前全局最优适应度值,更新全局最优粒子的位置和适应度值.第 i 个粒子的速度和位置更新如式(6)和式(7)所示:v(i+1)d=wvid+c1r1(pidxid)+c2r2(pgdxid)(6)x(i+1)d=xid+v(i+1)d(7)pidpgd其中,是个体已知最优解,是种群已知最优解,w 为惯性权重,c1,c2为学习因子,r1,r2是 0,1 范围内的随机数.(3)判断算法收敛条件是否满足.若满足,则停止迭
21、代,输出结果;否则跳转到第 2 步继续执行.1.3 改进的粒子群优化算法在 PSO 算法中,惯性权重因子代表的是粒子继承上一次迭代速度的能力,惯性因子参数的设置会严重影响 PSO 算法的全局和局部搜索能力.由于 PSO 算法中惯性因子是固定的,则会导致其收敛速度慢且容易陷入局部最优.搜索初期,需要一个较大的惯性权重因子进行全局寻优.搜索后期,需要一个较小的惯性权重强化局部搜索能力,为了更好地平衡算法的全局和局部搜索能力,本文设置了自适应的惯性权重因子 w,如式(8)所示,该参数可以随迭代次数的递增而变化,改进后的算法称为 IPSO.w(t)=(wmaxwmin)/(1+exp(15tT8)+w
22、min(8)wminwmax其中,表示初始的惯性权重值,表示最大迭代次数时的惯性权重值,T 表示最大迭代次数,t 代表当前迭代次数.2构建 IPSO-SVM 气温预测模型 2.1 数据来源和预处理在天气预报、气候评估及气象服务等领域,温压2023年第32卷第9期http:/www.c-s-计 算 机 系 统 应 用ResearchandDevelopment研究开发205湿风和能见度是最核心的观测要素,是计算其他相关指标的基础要素,也是社会大众最关注的天气信息;地面自动气象站的观测任务不一,这几个要素是普遍考核要素,各种尺度的天气现象由热力和动力条件配合而发生的,温压湿风可以定量地对热力和动力
23、条件诊断分析,因此本文选取了兰州地面自动站观测数据作为研究样本,采集时间为 2019 年 3 月 1 日 00 时至2019 年 4 月 30 日 23 时,每隔 1h 采集一次,采集要素为能见度,气压,相对湿度,风速,风向和气温,这些数据集来源于甘肃省气象局气象大数据云平台 API 接口,其原始观测数据如表 1 所示,表 1 选取了部分数据.表 1原始气象数据集能见度气压相对湿度风速风向气温14721842.62814419.513704842.2291.228121.712949841.1391.132822.713976839.4391.724825.216153838.1361.711
24、327.16375836.7332.410028.2数据预处理主要包括两个方面,即数据清洗和原始数据归一化处理.(1)数据清洗.原始数据质量可以很大程度决定模型的预测结果,在保障数据质量的情况下研究预测模型才是有意义的,为了提高数据的质量和可用性,数据清洗是在数据被使用之前必不可少的环节.具体包括重复数据、异常值、空值等.本文编写了 Java 程序对重复数据进行删除,对原始数据进行异常检测,将检测到的异常值设置成空值,对空值采用领域平均法进行填补,清洗后的样本数据集共有 1416 条记录,每一条记录包含 6 个要素特征.(2)数据归一化.不同的气象要素有不同的单位,为了消除不同气象要素之间的量
25、级对预测结果造成的影响,使得输入的数据处于同一个区间.本文采用最值归一化的方法对输入数据进行无量纲处理,将数值归一化到区间 0,1 之间,在完成预测之后将预测值反归一化为原始值21.数据归一化如式(9)所示:xi=xixminxmaxxmin,i=1,2,n(9)xmaxxminxi xi其中,和是清洗后数据集的每个气象要素的最大值和最小值,为第 i 个输入变量.为归一化之后输出的变量.2.2 IPSO-SVM 气温预测模型本文选取了兰州地面自动站观测数据作为研究样本,利用采集的数据对 IPSO-SVM 气温预测模型进行训练和测试.本文选取样本的 80%作为训练集,20%作为测试集.IPSO-
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 改进 PSO SVM 回归 模型 气温 预测 中的 应用
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。