基于机器学习算法的西部方向气候模式预测订正研究.pdf
《基于机器学习算法的西部方向气候模式预测订正研究.pdf》由会员分享,可在线阅读,更多相关《基于机器学习算法的西部方向气候模式预测订正研究.pdf(6页珍藏版)》请在咨信网上搜索。
1、 年第 期(第 卷总第 期)基于机器学习算法的西部方向气候模式预测订正研究杨理智 张栌丹 王俊锋 张 帅 严渝昇(中国人民解放军 部队 四川 成都)摘 要:基于气候预测对西部方向环境保障的重要性 针对高原地区气候模式准确度不高的现实困境 采用大数据挖掘技术 充分处理气候系统非线性统计特征 首先利用随机森林 对气候模式融合网格数据进行订正 而后将订正网格进行 分解 采用信息流算法挖掘环流因子与时间序列因果关系 构建不同模态下高影响因子集 采用随机森林进行建模 预报不同模态的时间序列 最后还原预报的格点场 完成模式格点数据修订 结果表明 经机器学习算法修订后的气候模式预报准确度、预报技巧显著提高
2、同时 模型预报的稳定度也有较大提升 本研究基于机器学习算法进行气象大数据挖掘 提升气候模式预测效能 旨在为提升西部方向气候预测水平提供方法思路关键词:气候预测 大数据挖掘 信息流 随机森林中图分类号:/文献标识码:/引用格式:杨理智 张栌丹 王俊锋 等.基于机器学习算法的西部方向气候模式预测订正研究.网络安全与数据治理 ():.():.:引言气候预测方法有统计学、动力学和动力统计相结合三类方法 统计学方法由于指数因子过多且各因子相互作用过程复杂 难以基于简单的人工分析把握主要统计要素 因此不确定性较高 动力学方法基于数值预报模式 受初始扰动和大气可预报性影响 气候预测技巧有限 特别是青藏高原地
3、区海拔高且地形复杂 气候动力模式难以精准捕捉气候过程 从而表现出了明显偏差 动力统计结合方式为现在主流方式 能弥补统计和动力方法各自的不足 明显提升预测准确度 因此 利用统计学方法订正西部方向气候模式 以提升预报准确度是值得探索的一个方向近年来 大数据分析挖掘技术 机器学习正腾飞发展 也在对数据关键信息的提取、识别和预测上取得了巨大成就 充分利用大数据分析挖掘技术 优化传统统计预测方法 是提升高原地区气候预测准确度的重要途径 气候预测准确性的影响因子众多 包含不同起报时间的模式场数据以及前期环流特征等 因子数量多、人工智能 年第 期(第 卷总第 期)呈现显著的非线性 机器学习算法能够挖掘大数据
4、规律区别于传统统计方法 它从数据出发进行学习 具有很强的处理非线性问题的能力 能够从地气系统大数据中发现 并 挖 掘 分 析 相 互 关 联 信 号 提 升 气 候 预 测技巧 机器学习已经被广泛应用于气候预测中 涌现出大量创新创造性成果 机器学习方法常与数值模式融合 等用神经网络模拟云和对流中热量、水汽的垂直输送以及辐射与云和水蒸气的相互作用 更有效地改进数值模式的模拟性 对气候模式的发展和预测水平的提高带来深远影响 机器学习也被广泛用于订正动力模式偏差 和 使用 模型对 的南美洲北部降水进行订正 效果显著优于线性回归模型 等 用随机森林、支持向量、贝叶斯模型等工智能模型订正偏差 从而提高动
5、力模式预测水平机器学习算法对提升气候预测业务水平也有极大的贡献黄超等采用随机森林挑选因子、多层前馈神经网络、支持向量回归和自然梯度算法建立模型 有效提升了湖南夏季降水的预测能力 邓居昌等用多种机器学习算法构建广西月降水量预测统计订正 结合动力模式方法极大提升了预测准确率 向波等创造性地将机器学习算法融入多省市的气候预测业务中 成功优化预测效果上述研究在气候预测中机器学习算法的应用领域做出了较大贡献 但由于模式表现差、测站少等原因 鲜有研究关注西部方向 因此 本文利用西部方向 个区域站 年观测数据、国内外主流气候模式数据、前期环流特征等大数据样本 基于 分解的时间系数 采用信息流算法分析挖掘数据
6、因果特征 运用机器学习算法构建高影响因子集与时间系数的预报模型 以优化模式预报场 最后将模式数据、重构预报数据插值回 个区域站 分析对比模型预报效果 探索基于机器学习算法的气候模式订正方法在西部方向的适用性 订正模型构建 模型构建本文基于机器学习算法实现气候模式订正 技术方案如图 所示具体步骤如下:()融合格点场 取 预报场和 预报场的均值 形成融合格点场()订正格点场 将融合格点场插值到站点 并作为输入 站点实测数据作为输出 利用随机森林训练订正模型 从而订正融合格点场 形成订正预报场()分解 对订正后的格点场进行 分解得到前 个模态的空间系数、时间系数 将前 个模态图 建模流程的时间系数作
7、为模型的预测因子()影响因子选取 采用信息流算法 寻找前 个模态时间系数与起报前 个月环流指数的因果关系 构建高影响因子集()机器学习建模 采用机器学习算法 对不同模态的高影响因子集与前 个模态的时间系数进行建模得到预测的时间系数()重构格点场 利用前 个模态空间系数及预测的时间系数 得到预报的格点场()预测效果评估 将预报的格点数据插值到西部方向 个站点上 通过 评估预报准确度 通过 评分、评分分析模型预报技巧 核心算法简介 随机森林随机 森 林()算 法 是 年基于 思想首次提出的一种分类和回归算法 它由相互独立的单棵决策树组成 使用多棵决策树样本进行训练和预测 最后利用投票机制来实现最终
8、的分类 具体算法流程如下:()矩利用自助重采样方法 从原始样本集 中采用有放回的采样方式 随机抽取 个样本子集()从 个样本子集中建立相应的 棵决策树:()()投稿网址:年第 期(第 卷总第 期)其中 为输入的自变量和因变量 为服从独立同分布随机向量()训练决策树模型节点时 随机选取 ()个预测因子作为树节点划分特征(为预测因子总个数)以其中最优的一个特征来划分决策树的左右子树()训练结束后 将投票得到的所有模态的平均值作为输出 得到随机森林模型预测结果()()()信息流区别于以往因果分析方法 近几年 突破性地证明了因果关系实际上具有严格的物理意义和理论基础:因果关系可以被一规范方程运用最大似
9、然估计所推得的闭合解(定义为信息流 )来度量 信息流不仅被证实在线性系统中能够快捷有效地探明因果信息交换情况 还在非线性系统的因果分析中展示了明显优于 因果测试法和转移熵的表现针对两两时间序列 和 运用最大似然估计推得从 向(注意方向性)传输的信息流可用如下公式计算:()其中 指 和 之间的协方差 而 由如下算法可得:令 是的欧拉前项有限差分项(一般取 只有高度混沌和极端密集项才取 )即:()其中 是时间步长 因此 实际上是序列 和 的协方差 理论意义上(实际应用时须结合假设检验)如果 则表明 不能引起(或者说 不是 的因)否则说明 有作用于(或者说 是 的因)预测结果评价方法 趋势异常综合评
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 机器 学习 算法 西部 方向 气候 模式 预测 订正 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。