用于高温次季节预报的深度学习方法_邓敏.pdf
《用于高温次季节预报的深度学习方法_邓敏.pdf》由会员分享,可在线阅读,更多相关《用于高温次季节预报的深度学习方法_邓敏.pdf(5页珍藏版)》请在咨信网上搜索。
1、第 39 卷 第 2 期 福 建 电 脑 Vol.39 No.2 2023 年 2 月 Journal of Fujian Computer Feb.2023 本文得到国家重点研发计划“重大自然灾害监测预警与防范”专项(No.2018YFC1505805)、福建省引导性项目“福建省前汛期持续性强降水过程延伸期预报的人工智能技术研究”(No.2021Y0057)、福建省引导性项目“基于深度时空多尺度交叉注意力的华南前汛期极端降水延伸期预报研究”(No.2022Y0008)资助。邓敏,男,1998 年生,主要研究领域为人工智能应用。E-mail:。游立军(通信作者),男,1974 年生,主要研究领
2、域为延伸期预报、气象信息技术。E-mail:。翁彬,男,1981 年生,主要研究领域为人工智能理论与应用。E-mail:。郑子华,女,1976 年生,主要研究领域为人工智能、信号处理。E-mail:zh_z_。叶锋,男,1978 年生,主要研究领域为人工智能应用。E-mail:。用于高温次季节预报的深度学习方法 邓敏1,2,3 游立军4 翁彬1,2,3 郑子华1,2,3 叶锋1,2,3 1(福建师范大学计算机与网络空间安全学院 福州 350117)2(数字福建大数据安全技术研究所 福州 350117)3(福建省公共服务大数据挖掘与应用工程技术研究所 福州 350117)4(福建省气象科学研究所
3、 福州 350007)摘 要 高温是一种比较常见的气象灾害,对人们日常生活和健康以及国民经济都有一定的影响。准确地预报未来 10-30 天(次季节)的每日高温天气状况,有助于人们及早地做出对应的决策和降低财产损失。本文设计了一种深度学习模型,通过对两个 Encoder 提取的大气环流和地表高温的特征进行延迟融合,并结合 Decoder 逐日输出高温预报结果。实验结果表明,本文的方法有较好的预测效果,相较于单个 Encoder 的深度学习方法,均方根误差降低了 2.12%,异常相关系数提高了 2.72%,决定系数提高了 0.04。关键词 高温次季节预报;深度学习;气象预报数据 中图法分类号 TP
4、389.1 DOI:10.16707/ki.fjpc.2023.02.001 A deep Learning Method for Sub-seasonal Forecast of High Temperature DENG Min1,2,3,YOU Lijun4,WENG Bin1,2,3,ZHENG Zihua1,2,3,YE Feng1,2,3 1(College of Computer and Cyber Security,Fujian Normal University,Fuzhou,China,350117)2(Digital Fujian Institute of Big Dat
5、a Security Technology,Fuzhou,China,350117)3(Engineering Technology Research Center for Public Service Big Data Mining and Application of Fujian Province,Fuzhou,China,350117)4(Fujian Institute of Meteorological Sciences,Fuzhou,China,350007)Abstract High temperature is a common meteorological disaster
6、 that has a certain impact on peoples daily life and economy.Accurate forecasting of daily high temperature weather for the next 10-30 days(sub-seasonal)can help people make early decisions and reduce damage.In the paper,a deep learning model was design by late fusion the futures of atmospheric circ
7、ulation data and surface high temperature extracted by two Encoders,and combining with Decoder to output day-by-day high temperature forecasting results.The experimental results show that the proposed method has better prediction effect,with a 2.12%reduction in root mean square error,a 2.72%improvem
8、ent in anomaly correlation coefficient and a 0.04%improvement in coefficient of determination compared to the deep learning method with a single Encoder.Keywords Sub-seasonal Horecast of High Temperature;Deep Learning;Meteorological Forecast Data 1 引言 目 前 的 天 气 预 报 依 赖 于 数 值 天 气 预 报(Numerical Weathe
9、r Prediction,NWP)模型1。但数值模型初始条件的不确定性和大气本身的混沌2 邓敏等:用于高温次季节预报的深度学习方法 第 2 期 性质导致数值预报的结果存在偏差2,需要进一步处理。其中,受大气中的风速、湿度和垂直速度等环流要素的影响,地表高温和环流要素的预报偏差存在非线性关联。次季节预报通常是指在 10-30 天的时间尺度上进行天气预报。由于严重依赖于当地天气和全球气候变量的变化,次季节预报一直被认为是“可预测性沙漠”3-4。但是在公共卫生和水资源管理等许多部门的决策中,需要关于这些时间尺度的可靠的和可操作的预测3,5。高温是一种比较常见的气象灾害,对人们日常生活和健康以及国民经
10、济各部门都有一定的影响。中国气候变化蓝皮书(2022)指出中国升温速率高于同期全球平均水平6,是全球气候变化的敏感区。提前 10-30 天的高温预报有助于人们更早地制定决策和降低生命财产损失。随着人工智能的快速发展,人们对基于统计机器学习的天气预测方法的兴趣正在迅速增长,且获得了不错的预测结果,例如天气预报、次季节预测和气候预测等7-11。因此,将深度学习应用在次季节时间尺度上对高温进行预报具有巨大的研究意义。其中,Jin W 等人验证了深度学习在次季节高温预报方面的有效性10。但该工作仅考虑纯地表高温,并没有在预报过程中考虑大气环流要素。本文基于 UNet 网络12,将大气环流和地表高温这两
11、类数据进行融合,并对中国大陆东部地区的夏季未来 30 天内的日高温进行逐日的确定性预报。本文的创新点如下:(1)基于 UNet 设计了一个融合多种气象数据进行次季节高温预报的基础模型。它用同一个编码器(Encoder)同时提取大气环流和地表高温的特征,为后续高温次季节预报研究提供基础。(2)针对大气环流与地表高温的不同物理特性,提出了 CTUNet。它利用两个编码器分别提取大气环流特征和地表高温特征,并将这两个特征进行延迟融合。实验结果表明,基于深度学习的高温次季节预报的方法均优于传统的天气预报方式。其中,相较于 UNet 模型,本文提出的 CTUNet 在均方根误差(Root Mean Sq
12、uare Error,RMSE)上降低了 2.12%,在异常相关系数(Anomaly Correlation Coefficient,ACC)上提高了 2.72%,在决定系数(Coefficient of Determination,R2)上提高 0.04。2 相关工作 目前,天气预报在很大程度上依赖于基于物理的动力学模型的集合预报13。但与气候态相比,在次季节到季节(Sub-seasonal to Seasonal,S2S)的时间尺度上集合预报显示了有限的预测技能14-16。为了了解导致提高 S2S 预报可预测性和改善的条件,已经建立了 S2S 和 SubX 等项目17-18。机器学习(Ma
13、chine Learning,ML)已经被应用于各种预测系统中,有助于提高不同时间尺度上的预测技能。尤其是深度学习的发展,使得 ML 模型的性能在天气预报和季节预测等方面比动力学模型更具竞争力7,11,19,20。特别是,ML 模型已经开始应用于提高预测次季节时间尺度的温度、降水和其他气候变量的预测技能8,9,21-27。He 等人在次季节时间尺度上对一套现代 ML方法进行了比较28,包括非参数 AutoKNN、多任务 Lasso、梯度增强树和深度编解码器网络,表明ML 模型平均在 SSF 上优于动力学模型,并且探索通过使用动力学模型的预测来增强 ML 模型,这也为本文的研究提供数据可行性分析
14、。3 数据和方法 本文提出一种高温次季节预报模型,对中国大陆东部地区未来 30 天的每日最高气温进行确定性预报。模型结合动力学预报模式的环流要素场和高温要素场,经深度学习网络 CTUNet 后给出特定日期的距地面 2m 的高温预报。3.1 数据 本文使用两个数据集。来自欧洲中期天气预报中心(European Centre for Medium-Range Weather Forecasts,ECWMF)的次季节到季节预测项目(https:/www.ecmwf.int/en/forecasts/dataset/sub-seasonal-seasonal-prediction)提供的全球范围的回报
15、数据作为输入数据集。本文选取覆盖中国大陆东部地区(19.5N45N,105E132.0E)的 6 个环流要素(Q700,U200,U850,V200,V850,W500)和高温要素(TMAX)。标签数据集为由中国气象台 提 供 的 全 国 日 高 温 站 点 插 值 数 据(http:/ 342 个网格点。这些数据的时间范围为 1998-2014 年每年的 6-9 月。其中,1998-2008年为训练数据,2009-2011 年为验证数据,2012-2014年为测试数据。2023 年 福 建 电 脑 3 3.2 算法流程 高温次季节预报流程如图 1 所示,包含模型构建和模型评估两部分。首先,对
16、 S2S 项目和中国气象局提供的气象数据进行数据预处理操作,根据实验要求分别提取出覆盖中国大陆东部地区的环流输入数据、高温输入数据以及高温观测数据。这些数据都需要经过归一化处理来映射到同一尺度上,才能送入 CTUNet 网络。然后,将得到的数据输入到 CTUNet 网络进行模型训练,输出高温预测数据。最后,本文将 CTUNet 网络和其他基准进行比较评估分析,包含总体误差评估分析、误差的空间分布评估以及预报个例检验。图 1 高温次季节预报流程图 3.3 CTUNet网络 图 2 UNet 网络结构 深度学习网络UNet的Encoder-Decoder结构可以很好地处理不同数据之间的非线性关系。
17、首先基于 UNet 设计一个深度学习模型应用在次季节预报中。如图 2 所示,该 UNet 网络由 Encoder、Decoder和跳跃连接构成。Encoder 由 1 个输入模块和 4 个下采样模块构成。每个输入模块含有两层 33 卷积层,下采样模块包含两层 33 卷积层和 1 层 22 最大池化层。Decoder 由 4 个上采样模块和 1层 11 卷积层构成。每个上采样模块含有 1 层上采样的卷积层和 2 个 33 卷积层。跳跃连接将Encoder 的特征融合到 Decoder 对应的特征中。该UNet 模型输入数据是大气环流数据和地表高温数据的通道拼接,并没有将两种类型物理数据的特征提取
18、进行分离。为了更好地拟合环流数据和地表高温之间的非线性关系,本文在 UNet 的基础上提出 CTUNet模型。它的网络结构如图 3 所示,用两个 Encoder分别提取环流数据和高温数据的特征,并采用延迟的方式将这两个特征进行融合(相加),最终由Decoder 输出高温预报。其中,跳跃连接只将高温的 Encoder 和 Decoder 联结在一起。CTUNet 避免了环流数据与高温数据过早的特征融合,更有利于两种不同类型物理属性要素的特征之间的深度融合。图 3 CTUNet 网络结构 4 实验和分析 4.1 评价指标 使用均方根误差(RMSE)、异常相关系数(ACC)和决定系数(R2)作为评价
19、指标。设Y?(n)表示真实观测值,Y(n)为对应的预测值,Y?(n)为气候态,表示对应日期过去 30 年的高温平均值。如公式(1)所示,RMSE 衡量真实观测值与预测值之间的差异,差异越小,表明预测的准确性越高。RMSE(Y?(n),Y(n)=1hw(L(i)(Y?i,j(n)Yi,j(n)2wj=1hi=1)(1)其中,预报日n=1,2,30,h和w表示数据的高和宽,L(i)=cos(lat(i)1Nlatcos(lat(i)Nlati具有消除气象数据在不同纬度上带来的误差的作用。ACC 量化了预测数据偏离气候态的差异与真实观测数据偏离气候态的差异在空间模式上的一致性。其表达如公式(2)所示
20、。ACC(Y?(n),Y(n)=L(i)(Y?i,j(n)Y?i,j(n)(Yi,j(n)Y?i,j(n)wj=1i=1L(i)(Y?i,j(n)Y?i,j(n)2wj=1i=1L(i)(Yi,j(n)Y?i,j(n)2wj=1i=1 (2)R2表示相对于最佳常数预测值(气候态)的相对预报技能。其表达如公式(3)所示。Relatie R2(Y?(n),Y(n)=1 L(i)(Y?i,j(n)Yi,j(n)2wj=1i=1L(i)(Y?i,j(n)Y?i,j(n)2wj=1i=1 (3)4.2 实验设置 4 邓敏等:用于高温次季节预报的深度学习方法 第 2 期 ECWMF 的 S2S 项目是传统
21、天气预报中最先进的次季节预报项目之一。他们提供的高温次季节预报数据集含有 1 个控制预测数据和 10 个成员的扰动预测数据。现提取控制预测(EMC)、10 个扰动预测的平均值(EMO)和中位数(EMM)作为基准,与 UNet、CTUNet 两种模型的预测结果进行比较。使用 RMSE、ACC 和 R2对 ECWMF 的 S2S 项目和两种深度学习方法在未来 30 天的次季节预报性能分别在时间和空间上进行评估。高温次季节预报模型训练默认 200 轮,每轮训练批量大小为 32。使用 Adam 优化器和余弦退火学习速率调度器,学习率为 0.0001,均方误差(MSE)作为损失函数。4.3 总体误差评估
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 用于 高温 季节 预报 深度 学习方法 邓敏
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。