基于机器学习技术的黄山风景区及周围雷电临近预报方法.pdf
《基于机器学习技术的黄山风景区及周围雷电临近预报方法.pdf》由会员分享,可在线阅读,更多相关《基于机器学习技术的黄山风景区及周围雷电临近预报方法.pdf(8页珍藏版)》请在咨信网上搜索。
1、Oct.2023METEORENEANIOINOLOGY7472023年10 月第51卷第5期JVol.51,No.5象技科基于机器学习技术的黄山风景区及周围雷电临近预报方法姚叶青1王传辉1慕建利2张蕾1王丽娟2(1安徽省公共气象服务中心,合肥2 30 0 31;2 中国气象局公共气象服务中心,北京10 0 0 8 1)摘要为探究影响山岳型景区雷电发展的关键因素,实时掌握黄山风景区及周围雷电发展趋势,采用多普勒天气雷达、气象探空、闪电定位等多种监测数据,根据雷电发生基本物理原理,从系统强度、旺盛程度和移动趋势3个方面提取雷达回波特征作为关键预报因子,基于多种机器学习算法建立了雷电临近预报模型,
2、结果表明:随机森林(RF)、逻辑回归(LR)、K-临近(KNN)、贝叶斯(GNB)、支持向量机(SVM)5种机器学习算法均对雷电具有一定临近预报能力,RF的TS最高,SVM漏报率最低,LR空报率最低;在RF算法中雷暴系统强度和发展旺盛程度两类因子起主要作用,其中作用最大的是雷暴系统强度中一2 0 层高度雷达基本反射率,其次是0 层以上回波厚度。关键词雷电临近预报;随机森林;多普勒天气雷达;一2 0 层雷达基本反射率;0 层以上回波厚度中图分类号:P429D0I:10.19517/j.1671-6345.20220347文献标识码:A引言雷电作为强对流天气伴随现象,可致人员伤亡、供电及通讯信息系
3、统故障或损坏,雷电灾害被联合国列为“最严重的十种自然灾害之一”1。为有效防范雷电灾害,近年来越来越多学者开展雷电临近预报预警方法研究,大量研究显示,雷达回波强度、回波顶高等参数与雷电发生存在较高相关性2-9,同时雷电发生时大气电场强度出现跃变等特征10-131为此,目前雷电临近预报主要采用雷达回波参量、大气电场强度等要素14-15,利用阈值判定、决策树、线性回归等方法5-131,如美国空军第45天气中队给出了以雷达为工具的雷电临近预报经验判定规则,主要包括最大回波强度及其出现高度、强回波体积、回波顶高等参数,通过判定规则预报云闪、地闪5。吕伟涛等6 利用雷达回波强度及其变化率、回波顶高等参数,
4、建立雷电活动概率预报模型。王飞等7、周明薇等8 、刘维成等9 从35dBz或40 dBz雷达回波是否突破0、一10 等特性层高度等角度进行关注,通过阈值判定或决策树方法预报雷电发生及出现时间。姚叶青等10 1通过对已出现闪电的风暴进行追踪和外推来进行雷电临近预报。周俊驰等1、王振会等12 、行鸿彦等13 主要从雷电活动中大气电场变化特征的角度进行研究,采用阈值法或建立回归方程进行雷电预警。大量研究表明,虽然雷暴云电荷结构呈现偶极、三级或多极性,而起电区主要位于0 层及以上不同高度,正负电荷区交错存在,0 层以上冰晶、霞、冰粒子数浓度、大小及垂直运动等是雷电非感应起电机制主要影响因子16-0 。
5、近年来雷电活动期间雷达回波特征的大量分析研究也印证了上述结论,如:雷电与0 层以上雷达回波强度存在较好相关性,雷电发生时0 层、一10 层、一2 0 层位势高度雷达反射率因子大、雷达回波顶高达7 km以上、垂直积分液态含水量大等雷达回波特征3.7.91,这些雷达回波特征体现了雷暴云中冰晶、霰、冰電粒子数浓度以及粒子大小,这与雷暴云非感应起电机制相吻合。同时研究表明,雷电活动强度http:/气象科技家重点研发计划项目(2 0 18 YFC1507802),安徽省气象局创新发展专项(CXM202207)资助国家重点研发计划项目(2 0 18 YFC1507802),安徽省气象局创新发展专项(CXM
6、202207)资助作者简介:姚叶青,女,197 0 年生,硕士,正研级高级工程师,研究方向灾害性天气预报方法及服务关键技术研究,Email:z mh h t 16 3.c o m收稿日期:2 0 2 2 年8 月2 5日;定稿日期:2 0 2 3年5月2 5日气象科技编辑部(CCBY-NC-ND4.0)748象第51卷技科与雷暴发展强度为正相关关系2 。可见,雷电大多产生于发展强盛的雷暴云中。以上大量文献表明,雷暴云发展强度、旺盛程度及移动趋势对雷电位置变化和发展趋势有较强指示意义。近年来机器学习算法在气象观测、数值天气预报、强对流天气识别预警以及卫星资料等领域应用越发广泛2 1,尤其是在天气
7、临近预报领域,广泛应用在风速短期、超短期预报2-2 3,雷达图像外推2 41,以及雷电临近预报14-15.2 51等等方面。以数据驱动的机器学习算法在气象科学领域应用并非取代物理建模方法,而是对物理建模方法补充和丰富,同时机器学习算法应遵循基本物理规律2 6 从以往研究中可以发现,目前大气电场仪有效监测范围小,数据质量参差不齐,推广到其他地区有一定难度。利用雷达数据进行雷电预报中,预报因子选取主要通过雷电与雷达产品相关性分析,导致影响雷电发生的预报因子可能被漏选。为此,本文基于雷暴云中非感应起电机制,从雷暴系统强度、旺盛程度及移动趋势3个方面的雷达特征提取预报因子,采用多种机器学习算法对比研究
8、,选取最优方法建立雷电临近预报模型,取得了较好的效果,为其他地区雷电临近预报提供参考。1资资料与方法1.1数据资料安徽省气象信息中心提供的2 0 15年9 月到2019年5月0 8:0 0 和2 0:0 0 每日2 次安庆站气温和位势高度探空数据,安庆探空站位于研究区域西侧6 0 km处;6 min间隔的黄山光明顶和铜陵多普勒天气雷达基数据,两站距离相对较近,其观测范围可覆盖黄山景区全境;以及研究区域范围内的闪电定位数据。研究区域为黄山风景区及周边(117.6 118.6E,2 9.7 30.7 N),地形情况见图1。1.2预报因子的预处理针对气象探空和雷达基数据两方面数据进行预处理。气象探空
9、数据主要用来确定以下两方面指标,其一是0、-10、一15、-2 0、一30 层共5层温度层的位势高度;其二,计算0 层和一2 0 层位势高度差(H。-2 0)。1.2.1雷暴云发展强度为反映雷暴云强度,预报因子选取0、一10、15、一2 0、一30 共5层基本反射率因子31.2Nm140031.01300120030.8110030.6X100090030.480030.270060030.050029.840030029.6117117.3 117.6117.9 118.2118.5E图1黄山风景区及周边(黑线所围区域)海拔高度分布(为铜陵雷达站;为光明顶雷达站;X为安庆探空站)Fig.1
10、Altitude of Huangshan Scenic Area and its surroundings(surroundedbytheblack line)(T o n g li n g r a d a r;G u a n g m i n g d i n g r a d a r;X A n q i n g r a d i o s o n d e)(Ba s i c Re f le c t i v i t y,以下简称BR)、垂直积分液态水含量(Vertical Integrated Liquid,以下简称VIL)以及VIL与回波顶高的比值。为区分不同方位回波强度对雷电发生的影响,进一步将
11、一10 层高度的BR按照方位分为东北(NE_BR)、东南(SE_BR)、西南(SW_BR)和西北(NW_BR)4个象限。1.2.2雷暴云旺盛程度选取回波顶高(EchoTop,以下简称ET)和0层以上回波厚度2 个方面来反映回波旺盛程度。0 层以上回波厚度为ET与0 层位势高度之差。1.2.3雷暴云移动趋势雷暴云前侧对流区通常表现为雷达基本反射率梯度大,雷电多发生于雷暴前侧对流云中,后侧多为层状云回波,较少产生雷电2 7 ,所以雷达基本反射率梯度大值区也是接下来发生雷电高风险地区。选取0 和一10 层高度雷达基本反射率水平梯度(分别记为0 _grad和一10 _grad),用以反映雷电移动趋势。
12、具体做法是分别计算X方向梯度和Y方向梯度,对任意一点A(,y,)X方向梯度和Y方向梯度计算方法见式(12),进而采用利用式(3)得到平面梯度。X林度=(Br(1u+1y.)-Br(a,-1 y,)/2(1)Y林度=(Br(Tu a+1)Br(n y-1)/2(2)亚面样庙2)1/2(3)平面梯度=(X梯度”+Y梯度)1/2式中,BR为基本反射率因子。749第5期姚叶青等:基习技术的黄山风景区及周围雷电临近预报方法2雷电临近预报方法建立2.1建模样本准备雷电发生发展主要有3方面的影响因素,分别为反映对流系统的强度因素、反映对流系统发展旺盛程度因素以及反映对流系统移动趋势因素。从这3个方面进行总结
13、预报模型的16 项输入因子(表1)。表1车输入预报因子Table 1A list of model input factors类别预报因子含义简写0层BR(基本反射率因子)反映0 层液态、固态混合降水粒子数浓度、大小0 _BR-10层BR反映一10 层过冷却水滴和霰、冰等固态粒子数浓度、大小-10_BR-15层BR反映一15层冰晶、霰、冰雷等降水粒子数浓度、大小-15_BR-20层BR反映一2 0 层冰晶、霞、冰電等降水粒子数浓度、大小-20_BR-30层高度BR反映一30 层冰晶、霞、冰電等降水粒子数浓度、大小-30_BR系统第一象限一10 层BR反映一10 层第一象限过冷却水滴和固态粒子数
14、浓度、大小NE_ BR强度第二象限一10 层BR反映一10 层第二象限过冷却水滴和固态粒子数浓度、大小SE_BR第三象限一10 层BR反映一10 层第三象限过冷却水滴和固态粒子数浓度,大小SW_BR第四象限一10 层BR反映一10 层第四象限过冷却水滴和固态粒子数浓度、大小NW_BRVIL(垂直积分液态水含量)系统垂直总含水量VILVIL/ET(回波顶高)系统垂直单位厚度平均含水量VIL/ETET系统发展高度ET旺盛0层以上回波厚度0层以上系统厚度,反映起电区厚度ET-Ho程度0与一2 0 层位势高度差反映0 与一2 0 层空气密度,影响大气稳定性,从而影响系统旺盛程度DHo-20移动0层BR
15、梯度反映雷电活动趋势和系统可能移动趋势o_g r a d趋势-10层BR梯度反映雷电活动趋势和系统可能移动趋势-10_g r a d将16 个预报因子通过线性插值方式形成1kmX1km分辨率数据集,利用闪电定位仪数据作为真实雷电发生数据,将闪电出现位置与出现前半小时内半径10 km范围内要素进行匹配,形成数据集样本,剔除掉雷达组合反射率小于15dBz的样本(在预测中直接将雷达组合反射率小于15dBz的地区输出无雷电)。通过2 0 15年9月到2 0 19年5月共整理得到348 457 个样本。在同一次雷暴过程中往往同一实况被多次应用,为此间隔2 个雷达体扫时间取一次样本。考虑到样本中无雷电发生
16、数据比例过高,对无雷电发生样本进行随机抽取达到样本均衡目的,最终形成有雷电与无雷电样本比例为1:3,共得到有效样本数量为59 133个2.2预测结果及检验采用RandomForest(RF)、Lo g i s t i c Re g r e s s i o n(LR)、K-Ne a r e s t Ne ig h b o r(K NN)、G a u s s ia n NB(GNB)和Support Vector Machines(SVM)共5种算法对样本进行训练,模型中不同的参数设置预测的结果会略存差异,通过不断试验,本研究各方法采用的参数见表2。将2.1节中有效样本按照3:1的比例随机分为训练
17、集和测试集,利用5种机器学习算法使用训练集进行训练,建立5种预测模型。利用测试集进行测试评估,具体测试方法和流程如下:首先将雷达产品插值为1km1km的格点数据,将数据输入训练好的预报模型后形成1km1km的雷电未来30min的是否发生的预报数据;然后用未来30 min内10 km半径范围内监测到闪电作为雷电出现实况对该预报结果进行准确性评估。测试情况见图2,其中漏报率、空报率和TS评分见式(4)(6)。(6)(5)确次数)有闪电预报正空报率:空报人(空报次数750象第51卷技科表2 5种机器学习算法参数设置Table2Parameter settings in 5 machine learn
18、ing algorithms算法参数设置n_estimators=10;criterion=gini;max_depth=9;min_samples_split=2;min_samples_leaf=l;min_weight_fraction_leaf=O;max_features=auto;max_leaf_nodes=None;min_impurity_decrease=O.;min_impurity_split=None;RFbootstrap=True;oob_score=False;n_jobs=l;random_state=None;verbose=0;warm_start=Fal
19、se;class_weight=Nonepenalty=12;dual=False;tol=le-4;C=1.0;fit_intercept=True;intercept_scaling=1;LRclass_weight=None;random_state=None;solver=liblinear;max_iter=100;multi_class=ovr;verbose=0;warm_start=False;n_jobs=1n_neighbors=5;w e ig h t s=u n if o r m;a lg o r it h m=a u t o;le a f _s iz e=30;p=2
20、;KNNmetric=minkowski;metric_params=None;n_jobs=1GNBpriors=NoneC=-1.0;kernel=rbf;degree=3;gamma=auto;coefo=0.0;shrinking=True;SVMprobability=False;tol=le-3;cache_size=200;class_weight=None;verbose=False;max_iter=-l;decision_function_shape=ovr;random_state=None1.0120007(a)(b)回漏报率 通空报率巴TS评分口无闪电预报正确闪电漏报
21、0.8口闪电空报有闪电预报正确SL/90000.660000.4-230000.200RFLRKNNGNBSVMRFLRKNNGNBSVM机器学习算法机器学习算法图2 利用测试集得到不同机器学习算法雷电预警模型测试结果:(a)各机器学习算法空报、漏报和预报正确数量,(b)各机器学习算法空报率、漏报率和TS评分Fig.2The lightning nowcasting model test results of different machine learning algorithms using the test set:(a)the number of false alarm,missing
22、 alarm and correct reports for each machine learning algorithm;(b)the false alarm rate,missing alarm rate and TS for each machine learning algorithm漏报率=漏报次数/(漏报次数十有闪电预报正确次数)(4)TS=有闪电预报正确次数/(空报次数十漏报次数十有闪电预报正确次数)通过图2 可以看出,5种机器学习算法中,RF算法TS最高,LR算法空报最少,但漏报较多。KNN和GNB在各项指标没有明显突出方面,各项指标表现相对均衡。SVM算法漏报最少,但其空报
23、明显高于其他算法,刘承启等2 5 利用决策树和SVM在雷电临近预报对比中得到相似的认识。可751姚叶青等:基于机器学习技术的黄山风景区及周围雷电临近预报方法第5期以看到,整体上不同预测方法准确率相差不大,但不同的算法优势不同。例如SVM算法正确率最低,但是闪电漏报确最少,在实际应用中可根据实际需求选取相应算法。下面以TS最高的RF为例分析各预报因子重要性。2.3各预报因子重要度评估RF算法能够根据各预报因子在RF中每棵树上做贡献大小,通过计算基尼系数作为衡量指标,贡献最大因子定义为10 0,计算其他各因子与贡献最大因子相对数值,作为各预报因子重要度(图3)。可以看到,在各预报因子中,一2 0
24、层BR在RF模型中重要度最高,其次为0 层以上回波厚度,其数值为30.8 9,另外大于2 0 预报因子包括一10 层BR、0 层BR、一30 层BR、VIL和VIL/ET。由此可见,在RF算法中系统强度和旺盛程度两类因子起最主要的作用。1007550-250.0a.0Hapel80.01-TILE/TIApei0.0预报因子图3各预报因子重要度Fig.3Importance of each factor3典型雷电过程预报案例研究表明,中国雷电主要集中在4一9月午后时段2 8 。2 0 2 1年8 月2 9日午后黄山风景区及周围出现了大范围强雷暴过程伴有大量的闪电发生,利用第2 节RF模型输出雷
25、电预报结果与未来30 min闪电定位仪得到闪电实际出现位置(图4)。从图4中可以看出实际闪电发生区与预报区域基本一致,在闪电高发区约152 0 km范围内存在部分空报,边缘有一些零星漏报,而6 min一次的预报更新基本可以解决漏报问题。在整个过程中空报率0.42 5,漏报率0.37 8,TS0.426。可见,RF模型在黄山景区具有较好的预报效果。(a)13:1830.6N30.430.230.029.8117.6117.8118118.2118.4 E(b)13:4830.6N30.430.230.029.8117.6117.8118118.2118.4E30.6N(c)14:1830.430
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 机器 学习 技术 黄山 风景区 周围 雷电 临近 预报 方法
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。