基于逐步多元线性回归和随机森林模型预测黄河流域极端气温事件.pdf
《基于逐步多元线性回归和随机森林模型预测黄河流域极端气温事件.pdf》由会员分享,可在线阅读,更多相关《基于逐步多元线性回归和随机森林模型预测黄河流域极端气温事件.pdf(15页珍藏版)》请在咨信网上搜索。
1、第 卷 第 期 年 月自 然 灾 害 学 报 .收稿日期:修回日期:基金项目:水利部黄河流域水治理与水安全重点实验室(筹)研究基金()国家自然科学基金项目()中国科学院地球环境研究所黄土与第四纪地质国家重点实验室开放基金项目()作者简介:陈俊清()女硕士研究生主要从事气候变化研究:.通讯作者:李 毅()女研究员博士主要从事气候变化研究:.文章编号:()./.基于逐步多元线性回归和随机森林模型预测黄河流域极端气温事件陈俊清李 毅王 斌杨雪宁刘峰贵(.西北农林科技大学 水利与建筑工程学院教育部旱区农业水土工程重点实验室陕西 杨凌.水利部黄河流域水治理与水安全重点实验室(筹)河南 郑州 .澳大利亚新
2、南威尔士州初级产业部澳大利亚 新南威尔士州 .青海师范大学 地理科学学院青海 西宁)摘 要:全球变暖背景下极端气候事件频发且对黄河流域等地区的经济发展及人民生活造成严重危害 基于 年黄河流域 个站点的日气温数据提取了 个逐月极端气温指数()利用多重共线性分析去除有相依性的环流指数并考虑滞后性进行 相关分析筛选出各 的关键环流指数及最佳滞后时间之后基于最佳滞后时间下的关键环流指数建立逐步多元线性回归()和随机森林()模型 对模型进行精度评价探究环流指数在单站点及整个流域的重要性并预测了 年 月的 个 值 结果表明:黄河流域 中最高气温()、暖昼天数()、酷热天数()和最低气温()呈波动上升趋势而
3、霜冻天数()和冷夜天数()呈下降趋势极端高温事件的强度和发生频率的空间分布特征与极端低温事件基本相反以靖远站 为例各关键环流指数对 具有不同程度的影响(.)对应的最佳滞后时间主要为、个月 和 模型对黄河流域各 的预测能力都较好验证期的决定系数()范围分别为.和.除对 的模拟效果稍弱外其他 个 的 模型模拟效果均优于 模型 太平洋区极涡强度指数()是影响黄河流域、和 的最重要环流因子北非北大西洋北美副高脊线位置指数()对 和 的影响最大 预测的 年 月 的空间分布特征与多年平均情况基本相似 研究结果为黄河流域极端气温事件预报提供了参考关键词:极端气温指数环流指数随机森林模型逐步多元线性回归模型黄
4、河流域中图分类号:文献标识码:(.().):.第 期陈俊清等:基于逐步多元线性回归和随机森林模型预测黄河流域极端气温事件 ().().()().:.(.).()().:引言联合国政府间气候变化专门委员会()第六次报告指出 年全球平均地表温度较 年升高约.全球变暖背景下干旱、暴雨和热浪等极端事件呈增加态势不仅加剧了旱涝灾害、造成农作物减产而且严重危害了人体健康 极端气候事件是指天气变量观测值超过某一阈值时的小概率事件 气候变化检测和指数专家组()定义了 个具有代表性的极端气候指数包括极端气温和极端降水两大类指数已被广泛应用于全球或区域尺度极端气候研究 其中 定义了 个极端气温指数()可从不同角度
5、评估极端气温事件例如强度指数有最高气温()和最低气温()相对阈值指数有暖昼天数()和冷夜天数()以及绝对阈值指数霜冻天数()等而酷热天数()作为表征极端气温事件的绝对阈值暖指数在极端气温事件评估中具有很好的适用性大量研究人员对极端气温指数进行分析预测为缓解气候变化可能造成的不利影响提供了参考 研究者们采用多种方法对 与其关键影响因子进行建模并预报极端气温事件 如逐步多元线性回归模型()可较好地描述极端气温指数与多个影响因子之间的定量关系如 等利用 模型量化分析了湖北省植被对极端气候指数的敏感性 随着大数据时代的到来各种机器学习模型被广泛应用其中随机森林()模型是 建立的一种组合式机器学习方法具
6、有准确性高、不易过拟合的优点能有效处理大数据集并判定变量的重要性 等利用机器学习方法对北京地区网格温度进行了预报 等对比了多元线性回归()、梯度提升决策树、最近邻法、随机森林、极端梯度提升()和深度神经网络()等 种机器学习方法对近地面气温的预报此外极端气温事件与大气环流变化的密切联系为极端气温事件的预报提供了新的研究方向 大气环流会促进高低纬度之间及海陆之间的水热交换是影响气候的重要因素 大气环流异常往往会导致极端气自 然 灾 害 学 报第 卷温事件的发生因此常用环流指数来定量表征大气环流的变化而大气环流通常分为大气类、海温类和其他三类 目前已有诸多学者开展了大量针对极端气温事件影响因素的研
7、究发现大气环流对极端气候事件的发生具有重要影响 梁苏洁等分析并采用了北极涛动、北大西洋涛动、太平洋北美型和平流层极涡 种大气遥相关型指数构建了多元回归统计方程对华北地区冬季极端低温事件进行了预测 戴声佩等对华南地区极端气温事件进行大尺度环流影响分析指出厄尔尼诺南方涛动()异常与华南地区极端气温事件关系密切南海副高强度指数和西太平洋副高强度指数也对极端气温事件有明显贡献黄河发源于青藏高原是我国第二大河流经内蒙古高原、黄土高原和黄淮海平原最终汇入太平洋 黄河流域位于 面积约.主要是干旱半干旱地区其年平均降水量为 年平均气温为 全球变暖背景下黄河流域极端气温事件频发苗书玲等发现黄河流域极端气温指数在
8、流域西北部有明显的下降趋势东部则上升趋势明显 张克新等也发现黄河流域极端气温事件和厄尔尼诺南方涛动()指数存在多尺度的显著相关性 尽管目前国内对极端气温事件的时空变化及其成因分析已有相关研究但研究大多采用主成分分析、基于 软件的因子分析等统计分析方法对于 等机器学习模型的应用还较少 此外诸多学者在单个大气环流因子如对极端气温事件的影响方面取得了成果但极端气温事件的成因复杂受到诸多因素的共同作用综合考虑多种大气环流因子对黄河流域极端气温事件的预测研究还不够深入 黄河流域是气候变化的敏感区长期以来频发的极端气温事件对该区域生态系统和人类生活造成严重影响 探究黄河流域极端气温事件的气候驱动要素及其预
9、测能够为适应气候变化、流域生态环境保护和防震减灾提供重要的科学依据本文在收集 年 月 年 月环流指数数据和 年 月 日 年 月 日黄河流域 个站点气温数据的基础上分析黄河流域极端气温事件的时空分布特征及其对环流的响应规律运用 和 模型模拟极端气温指数并利用环流指数对未来极端气温指数进行预测以期揭示黄河流域极端气候事件的变化规律及成因为极端气温的预报提供科学依据材料和方法.数据收集黄河流域 个气象站点 年 月 日 年 月 日的逐日气温数据来源于中国气象科学数据中心(:/.)经检查该数据具有一致性和完整性数据缺失率分位值的天数频率酷热天数/日最高气温 的天数频率最低气温/每月日最低气温的最小值强度
10、冷夜天数/日最低气温分位值的天数频率霜冻天数/日最低气温 的具有显著共线性的环流指数 经分析最终保留了 个环流指数.关键环流指数的筛选单站点 个 对应的关键环流指数具有差异但相邻站点关键环流指数较相似故对各站点进行关键环流指数的筛选以便用于建模 用 相关系数 表征每个 与各环流指数之间的相关程度初步分析两者关系发现 和环流指数之间的相关性基本具有 个月的周期因此分别计算滞后 个月情况下、各 与经过多重共线性分析筛选的 个环流指数之间的 值 的取值范围是()表示正(负)相关越大相关性越高 根据 的临界值表当显著性水平.模型的建立及模拟.逐步多元线性回归模型()由于 与各关键环流指数的相关系数 随
11、滞后时间(月份)变化因此取 最大()时的滞后时间对应的多个关键环流指数进行建模、和 表征极端气温事件发生的频率单位为、且只能为正值 模型采用原始数据得到的模拟值存在负值因此将各站点、和 的序列进行对数转换 以 年的数据作为率定集 年的数据为验证集建立各对数转换后的 序列和特定滞后时间下关键环流指数之间的 模型该模型表示为 ()式中:为 其中 和 采用原始数据而、和 为对数转换后的序列 为对应 的滞后时间为 个月的第 个环流指数 为偏回归系数 为截距.随机森林 模型随机森林模型是通过 重抽样构建决策树的组合分类器模型具有良好的分类筛选与预测性能 利用与 模型数量及滞后时间一致的环流指数对各 采用
12、 建模以 年的数据作为率定集 年的数据为验证集并与 模型的建模效果进行比较在 模型训练中需确定 个参数:决策树数量()和每个树节点上随机变量的数量()对于回归问题一般取 设置为回归模型所有预测变量数的/模型通过均方误差增量()评估变量的重要性对每棵决策树的输入变量 进行随机扰动后自 然 灾 害 学 报第 卷检验袋外数据()的均方误差 值越大表示变量越重要计算公式为 ()()式中:为第 个变量的()为未受到扰动的袋外数据的均方误差为随机扰动后袋外数据的均方误差由于模型实际包含的环流指数数量及其重要性在黄河流域 个站点存在差异因此提出新的重要性评估指数()以表征各环流指数在整个黄河流域上对极端气温
13、指数的影响程度表达式为 ()()式中:为第 个环流指数的黄河流域总体重要性()为站点 模型实际包含的环流指数的数量为第 个环流指数在站点 中的变量重要性名次为第 个环流指数在站点 的变量重要性()为黄河流域实际包含环流指数最多的站点的环流指数数量值越大说明该环流指数对整个黄河流域 的影响越大反之亦然.模型效果评价用决定系数()、林氏一致性相关系数()、平均绝对误差()以及均方根误差()来评估 和 模型率定和验证的效果 评价指标的计算式为 ()()()()()()()()()()式中:、为观测和模拟的第 个 值、为 和 的平均值、为观测和模拟的 值的方差、为观测和模拟的 值的平均值 为 观测值和
14、模拟值之间的 相关系数 为样本数估算的 和 值越高、和 值越低表明模拟性能更好结果与分析.极端气温指数 的时空变化黄河流域 年 个 的年际变化曲线及年极端气温事件的多年平均情况如图 所示 从时间变化来看极端气温暖指数 和 呈现出波动上升的趋势说明黄河流域极端高温事件的强度和频率均呈增加趋势对全球变暖呈正响应 极端气温冷指数、呈下降趋势 则呈上升趋势表征黄河流域极端低温事件的发生频率在减小强度也有所降低在空间分布上由图 可知、和 的值在黄河流域下游低海拔地区均较高同时该区域的 较大 和 的值则较低表明该地区极端高温事件的强度和频率均较大而极端低温事件的强度较弱且频率较低这可能是受到纬度和地形的影
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 逐步 多元 线性 回归 随机 森林 模型 预测 黄河流域 极端 气温 事件
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。