四川地区气温转折过程2m温度变化订正研究_冯良敏.pdf
《四川地区气温转折过程2m温度变化订正研究_冯良敏.pdf》由会员分享,可在线阅读,更多相关《四川地区气温转折过程2m温度变化订正研究_冯良敏.pdf(9页珍藏版)》请在咨信网上搜索。
1、第 41 卷 第 1 期2023 年 2 月Vol.41 No.1February,2023干旱气象Journal of Arid Meteorology四川地区气温转折过程2 m温度变化订正研究冯良敏1,2,周秋雪1,2,曹萍萍1,2,王佳津1,2(1.四川省气象台,四川 成都 610072;2.高原与盆地暴雨旱涝灾害四川省重点实验室,四川 成都 610072)摘要:基于四川地区19902019年的逐日2 m最高、最低温度站点实况数据,对气温转折天气过程进行统计和分析,在此基础上,应用 LightGBM(Light Gradient Boosting Machine)算法及 NCEP/NCA
2、R(National Center for Environmental Prediction/National Center for Atmospheric Research)逐日再分析资料,构建气温转折天气过程变温订正模型。结果表明:(1)出现气温转折过程最多的区域是高原与盆地的边坡过渡区,最少的是盆地;(2)各区域的气温转折过程具有明显的季节差异,均表现为春季最多、冬季最少,且春季的气温转折过程明显多于其他3季;(3)在19902019年验证集中,LightGBM订正模型表现较好,准确率为78.64%,平均绝对误差为1.35。(4)在2020年的独立样本测试中,LightGBM订正模型的准
3、确率为53.60%,平均绝对误差为2.19,整体订正效果优于ECMWF模式(European Centre for Medium-Range Weather Forecasting)、中央台城镇预报指导报(SCMOC)及四川省气象台数值预报客观释用城镇预报指导报(SPCO)的预报。关键词:气温转折过程;LightGBM算法;机器学习文章编号:1006-7639(2023)01-0164-09 DOI:10.11755/j.issn.1006-7639(2023)-01-0164中图分类号:P457.3 文献标志码:A引 言随着社会经济发展和人民生活水平的提高,人们对天气预报的准确率和精细化程度
4、提出了越来越高的要求。天气预报的精细化,既是现代天气业务发展的标志,也是天气预报技术发展到相对成熟阶段的必然趋势(冯慧敏等,2016)。2 m温度是天气预报中最基本的气象要素之一,不仅对人们生产生活有重要影响,是舒适度指数、医疗气象指数以及各项专题保障服务的基础,而且是干旱、霜冻、大雾等灾害性天气预报的重点关注因子,是农、林、牧、渔等部门判断灾害状况的重要指标(胡玉荣,2008;盛裴轩等,2003;薛志磊和张书余,2012)。数值模式预报被认为是目前天气预报中最有效的预报手段,过去几十年中,得益于理论研究的不断深入、气象观测系统的发展、同化技术的进步以及大型计算机计算能力的突破,数值天气预报精
5、度得到极大提升(Bauer et al.,2015;Bonavita et al.,2016),并凭借其客观化、定量化的优势在天气分析、精细化要素预报等方面发挥了不可替代的作用。但是由于大气的混沌特性及受制于不完善的物理框架和初始、边界条件,现阶段数值模式对降水、温度等地面要素的预报与实况还存在不同程度的偏差(孙敏等,2018;佟华等,2006;符娇兰和代刊,2016),而且不同模式对不同地区、不同季节和不同天气过程的预报稳定性也不一样,因而需要在数值预报的基础上进一步释用以提高预报产品的精度。目前针对模式温度偏差的后验订正主要包括模式输出统计法及卡尔曼滤波法等统计释用方法,并通过调整最优时窗
6、、空间插值优化及多模式集成等方案(何珊珊等,2021;王丹等,2015;吴启树等,2016;薛谌彬等,2019),明显改善了模式的系统性偏差问题,有效提高了2 m温度的预报准确率,使得误差在空间分布上更为均匀。近年来,随着计算机技术和应用数学的发展,机器学习逐渐在众多任务中取得超越传统方法的效果,其中 LightGBM冯良敏,周秋雪,曹萍萍,等.四川地区气温转折过程2 m温度变化订正研究 J.干旱气象,2023,41(1):164-172,FENG Liangmin,ZHOU Qiuxue,CAO Pingping,et al.Study of 2 m temperature variatio
7、n correction during transitional processes of temperature in Sichuan J.Journal of Arid Meteorology,2023,41(1):164-172,DOI:10.11755/j.issn.1006-7639(2023)-01-0164收稿日期:2022-05-16;改回日期:2022-10-25基金项目:高原与盆地暴雨旱涝灾害四川省重点实验室项目(2020-青年-020)资助作者简介:冯良敏(1987),女,硕士,高级工程师,主要从事数值模式释用与现代天气预报技术研究。E-mail:L。第 1 期冯良敏等:
8、四川地区气温转折过程2 m温度变化订正研究(Light Gradient Boosting Machine)算法是数据挖掘、分类预测等领域的研究热点,广泛应用于各行各业的分类及回归问题中。在气象领域,前人尝试将LightGBM算法应用于定时气温预报订正、强对流天气分类识别、大气能见度预报订正模型及包含多种机器学习算法的融合模型预测最大风速等工作中(刘新伟等,2021;刘军中,2021;谭江红等,2018;王志宇,2019),其中湖北省气象台建立的LightGBM定时气温预报订正模型已经实现业务化,其准确率在客观产品中排名靠前。四川整体地势西高东低,地形地貌复杂,气候复杂多样,不同地域的气温预报
9、受下垫面影响较大,且不同季节、不同天气过程等因素也造成了气温预报的不确定性。对四川地区模式预报的2 m温度检验表明,不同的主客观预报产品的预报能力呈现出明显的季节性及区域性差异,且在平稳天气时预报性能较优,而在天气变化的转折过程中预报稳定性及准确率波动较大。目前已有的LightGBM温度订正业务模型主要针对定时的 2 m 温度进行订正,而对转折性天气过程的温度变化订正研究较少。为此,本文首先分区域、分季节对四川省的气温转折性天气过程进行统计和特征分析,在此基础上基于LightGBM算法建立气温转折过程温度变化订正模型并检验其性能,以期为实际业务中转折性天气过程的2 m温度变化预报提供参考。1资
10、 料(1)四川省 156 个国家气象站逐日最高、最低2 m温度观测数据,资料时段为 1990年 1月 1日至2019年12月31日,共计30 a,用于统计逐日变温分布并定义气温转折过程;(2)上述观测资料及对应时段的 NCEP/NCAR 逐日再分析资料(水平分辨率为1.01.0),用于气温转折过程LightGBM模型建模;(3)2020年1月1日至12月31的日最高2 m温度观测数据及对应时段的 ECMWF(European Centre for Medium-Range Weather Forecasting)细网格模式(分辨率为0.1250.125)资料,用于模型检验。其中再分析资料和模式
11、资料选取的要素场包括1 000500 hPa 温度场、1 000100 hPa 相对湿度场、925500 hPa风场、500 hPa位势高度场、海平面气压场、白天时段(09:0020:00)降水量,并将这些要素通过双线性插值法插值到观测站点。文中所有时间均为北京时;另外,文中附图涉及地图均基于国家测绘地理信息局标准地图服务网站下载的审图号为GS(2016)1552号的标准地图制作,底图无修改。2气温转折过程定义及其特征2.1气温转折过程定义曹萍萍等(2018)根据海拔高度差异将四川地区划分为盆地、高原与盆地的边坡过渡区、川西南山地及川西高原4个区域(图1)。其中,盆地以海拔高度低于500 m的
12、丘陵地区为主;高原与盆地的边坡过渡区主要为海拔高度5001 000 m的龙门山沿线地区,受地形影响大;川西南山地主要为攀西地区,以海拔1 5003 000 m的山地为主;川西高原主要为甘孜和阿坝两州,以海拔3 000 m以上的高原为主。本文采用此划分方法统计4个区域的逐日最高温度及最低温度变化绝对值分布,结果如图2所示。可以看出,四川省4个区域的最高温度日变温幅度均比最低温度大,且绝对值分布更为分散。不论是最高温度还是最低温度,川西高原的日变温幅度均最大,川西南山地次之,盆地最小。从最高温度极值分布来看,川西高原和川西南山地均超过20.0,且差异较小,盆地为18.7,明显低于其余3个区域;盆地
13、、高原与盆地的边坡过渡区、川西南山地及川西高原的最低温度极值分别为13.9、14.4、15.3和16.6。虽然极值较大,但各区域最高温度和最低温度的第90个百分位数均低于各自极值的1/3,说明绝大多数的日变温绝对值位于低值段,其中最高温度的日变温中位数为1.82.0,最低温度的日变温中位数为1.11.6。另外,4个区域的最高温度和最低温度均值均略高于中位数。肖红茹等(2020)统计 19802017年四川盆地图1基于海拔(填色,单位:m)的四川地区分区(A区域:盆地;B区域:高原与盆地的边坡过渡区;C区域:川西南山地;D区域:川西高原)Fig.1Partitioning of Sichuan
14、region based on altitude(the color shaded,Unit:m)(A:the basin,B:the slope transition zone of plateau and basin,C:the mountains of southwestern Sichuan,D:the plateauin western Sichuan)16541 卷干旱气象的寒潮气温变化特征显示,72 h平均气温累积降温的第90个百分位数为5.4,与四川盆地寒潮天气业务标准(72 h内日平均气温持续下降超过6.0)较为吻合。由于最高温度较最低温度变化更明显,且在寒潮天气过程中24
15、h内主要表现为最高温度的下降,最低温度普遍下降不明显且近50%的站点趋于上升,因此选用最高温度逐日变温的第90个百分位数作为气温转折过程的统计标准,由于4个区域数值差异不超过0.6,且考虑统计方便,故将四川省气温转折过程的日变温标准统一设置为5.0。定义某一天某个区域大于等于50%的测站最高温度较前一天出现一致的升温或降温,且幅度大于等于5.0 时,则该区域出现一次气温转折过程。2.2气温转折过程分布特征图3为19902019年四川省4个区域的气温转折过程分布。全省近30 a共出现1 433次气温转折过程,其中升温过程略多于降温过程。出现气温转折过程最多的区域是高原与盆地的边坡过渡区(438次
16、),其次是川西高原(388次),最少的是盆地(302次),川西南山地出现气温转折过程的次数虽然与盆地相比差异不明显,但其升温过程明显较多,两者升温过程占比分别为63.6%和47.0%。对于气温转折过程较多的高原与盆地边坡过渡区和川西高原,升温与降温过程也表现为不同的分布特征,其中前者升温过程占比最高(74.2%),而后者升温过程占比最低(40.2%)。进一步分季节对四川省各个区域的气温转折过程进行统计(图4)后发现,各区域的气温转折过程分布具有明显的季节差异,均是春季最多、冬季最少,且春季的过程次数明显多于其余3季。但不同区域夏、秋季又展现出不同的变化特征,盆地、高原与盆地的边坡过渡区及川西高
17、原3个区域均是夏季的气温转折过程略多于秋季,而川西南山地则是秋季多于夏季。另外值得注意的是,盆地气温转折过程最少,其春、秋、冬季也均是4个区域中最少,但图319902019年四川4个区域升温及降温转折过程分布Fig.3Distribution of temperature transitional processes in four regions of Sichuan Province during 1990-2019图219902019年四川4个区域最高、最低2 m温度日变温绝对值的箱线图Fig.2The box plots of absolute values of daily vari
18、ation of the maximum and minimum 2 m temperature in four regionsof Sichuan Province from 1990 to 2019166第 1 期冯良敏等:四川地区气温转折过程2 m温度变化订正研究其夏季的过程次数却仅次于高原与盆地的边坡过渡区,位列第二。3基于 LightGBM 算法的气温转折过程温度变化订正模型3.1算法简介LightGBM是一种轻量级的梯度提升学习框架,由 微 软 公 司 2016 年 开 源,它 以 GBDT(Gradient Boosting Decision Tree)模型为基础,将许多准确率较
19、低的树模型组合起来,采用梯度提升迭代算法,在每次迭代时通过向损失函数的负梯度方向移动使得损失函数越来越小,最终得到一棵较优的树,并以此作为预测模型,其实质是一种将弱学习器提升为强学习器的集成学习算法(曹渝昆和朱萌,2019;张丹峰,2018)。此外,LightGBM 采用 2 种创新的采样算法,分别是互斥特征捆绑EFB(Exclusive Feature Bundling)和 基 于 梯 度 的 单 边 采 样 GOSS(Gradient-based One-side Sampling):EFB 算法针对维数特别大的特征,将互斥的特征捆绑在一起并加入一个偏移常量形成一个新的特征,从而减少特征数
20、目,因此降低了数据特征规模,提高了模型训练速度;GOSS算法排除了大部分具有小梯度的样本,只使用剩余样本进行信息增益估计,在保证信息增益的同时减小训练量,提高模型的泛化能力。因此,LightGBM 与其他传统 GBDT 框架相比,具有训练效率高、内存消耗小、准确率高及对并行学习和大数据友好等优点。GBDT中的决策树是一种预测模型,其流程是自根节点至叶子节点的递归过程,在每个中间节点寻找一个属性划分,采用 CART(Classification and Regression Trees)二叉回归树作为基学习器,内部结点特征的取值为“是”和“否”,递归地二分每个特征,从而将输入特征空间划分为有限个
21、单元,并在这些单元上确定预测的概率分布。本文中的“树”模型即是基于温、压、湿、风等特征因子的取值,通过构建树型决策结构来对最高温度逐日变化进行分析。设数据集为M,构建回归树的大体思路如下:考虑数据集M上的所有特征因子j,遍历每一个特征下所有可能的取值或者切分点s,来寻求最优切分并将数据集M划分成两部分M1和M2,其衡量方法是误差平方和最小化;分别计算M1和M2的误差平方和,选择最小的误差平方和对应的特征与分割点,生成2个子节点(将数据划分为两部分);对上述2个子节点递归调用步骤、,直到满足停止条件(如叶子个数上限)。回归树构建完成后,将整个输入空间划分为多个子区域,每个子区域的输出为该区域内所
22、有训练样本的最高温度逐日变化平均值。模型中采用的是均方误差(Mean Squared Error,MSE)损失函数,其数学表达为:MSE=1ni=1n(yi-ypi)2,其中yi为训练集中温度逐日变化观测值,ypi为预测值,n为总的训练样本。3.2特征因子选取特征因子向量描述了机器学习模型的内在构成因子,对特征因子的选取及其数据质量决定了模型效果的上限,一方面需要选取与待预测量相关性最强的影响因子从而学习到数据之间的内在客观规律,另一方面需要避免选取的因子过多而引起无效学习或陷入过拟合,即对气温转折过程中最高温度逐日变化的订正在训练集中效果很好,但在实际的测试集中效果很差。根据天气学原理,局地
23、温度的变化主要取决于温度平流和非绝热因子,在实际业务中,重点关注大气中低层的温度平流,而对于非绝热因子中的太阳辐射项,由于没有直接预报产品,主要关注相对湿度、低云量、总云量(与大气整层相对湿度有关)等要素。因而本项目选取的特征如下:925500 hPa的风场及其变化场(风场矢量场分解为u、v分量,共20个因子),代表影响某地的天气系统;1 000100 hPa 的相对湿度场及其变化场(20 个因子),代表某地上空的天空状况;1 000500 hPa的温度场及其变化场(12个因子),代表大气的基本冷暖状态及冷暖平流;此外选取海平面气压场及其24 h变压(2个因子),用于衡量冷空气活动及其强度;选
24、取500 hPa位势高度变化场,用于衡量大气中层气压场的波动;选取白天时段(09:0020:00)的降水量,用于衡量降水对气温变化的影响。图5为不同区域特征因子与最高温度变化之间图419902019年四川4个区域气温转折过程的季节分布Fig.4Seasonal distribution of temperature transitional processesin four regions of Sichuan Province during 1990-201916741 卷干旱气象的相关系数绝对值达0.3以上,且通过=0.05的显著性检验的因子分布,选取这些因子进行建模,其中盆地有 30个因
25、子,高原与盆地边坡过渡区有 26个因子,川西南山地有30个因子,川西高原有28个因子。整体上来看,各区域与最高温度变化正相关最高的因子为大气中低层温度的变化,负相关最高的因子为大气中低层的相对湿度变化及相对湿度值。此外,对于川西南山地和川西高原,与最高温度变化负相关最为明显的因子是海平面24 h变压,相关系数分别达-0.73和-0.64,这与四川地区预报员在制作高原地区预报时特别关注海平面气压场的变化这一经验相一致;南北风分量及其变化对最高温度的影响明显大于东西风分量,这是由于南风气流和北风气流的热力性质不一样;白天时段的降水与4个区域最高温度日变化均为负相关,但绝对值较小,可能是因为降水并非
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 四川 地区 气温 转折 过程 温度 变化 订正 研究 冯良敏
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。