基于R语言实现普通克里金插值法在空气污染暴露评估中的应用.pdf
《基于R语言实现普通克里金插值法在空气污染暴露评估中的应用.pdf》由会员分享,可在线阅读,更多相关《基于R语言实现普通克里金插值法在空气污染暴露评估中的应用.pdf(4页珍藏版)》请在咨信网上搜索。
1、著.424Jiangsu J Prev Med,Jul.Vol.34,No.4江苏预防医学2 0 2 3年7 月第34卷第4期基于R语言实现普通克里金插值法在空气污染暴露评估中的应用汤文斌,王玉斐,李徐凤,杨亮,丁震,郑浩?1.常州市金坛区疾病预防控制中心,江苏常州2 132 0 0;2.江苏省疾病预防控制中心摘要:目的基于R语言实现普通克里金插值法评估人群空气污染暴露,为空气污染暴露评估提供技术支撑。方法从空气质量与气象数据分享平台(https:/q u o t s o f t.n e t/a i r/)下载江苏省2 0 2 1年1月环境固定监测站点空气污染物数据,使用R语言中Tidyver
2、se包进行数据清洗和汇总,使用gstat包计算各监测点污染物监测结果与距离的半变异函数值及其散点图,根据散点图分布特点拟合变异函数,使用实际监测数据交叉验证变异函数,最后采用普通克里金插值法预测江苏省疾控中心及13个地级市疾控中心住地2 0 2 1年1月的各污染物浓度进行预测。结果基于R语言实现了普通克里金插值法对多种空气污染物浓度的估算,对各污染物的变异函数进行Pearson相关性检验,P值均 0.0 1。各污染物预测值和实际值相关系数(r):PM2.5为0.93(95%CI:0.890.95),PM1o为0.8 3(95%CI:0.750.88),S0,为0.6 1(95%CI:0.460
3、.72),NO,为0.7 1(95%CI:0.590.80),0,为0.6 0(95%CI:0.450.72),C0 为0.6 6(95%CI:0.520.76)。结论通过R语言gstat包能高效实现克里金插值的计算,评估结果可靠,为空气污染人群暴露评估提供了解决方案。关键词:空气污染;环境暴露;R语言;克里金插值中图分类号:R122文献标识码:A文章编号:10 0 6-90 7 0(2 0 2 3)0 4-0 42 4-0 4Application of theordinary kriging interpolation method for assessment ofexposure to
4、 air pollution based on R packageTANG Wen-bin*,WANG Yu-fei,LI Xu-feng,YANG Liang,DING Zhen,ZHENG HaoJintan District Center for Disease Control and Prevention,Changzhou,Jiangsu 213200,ChinaAbstract:ObjectiveeTo assess the exposure to air pollution using the ordinary kriging interpolation method based
5、 on Rpackage,so as to provide technical supports for assessment of exposure to air pollution.Methods Data pertaining to air pollutants infixed environmental surveillance stations in Jiangsu Province on January 2021 were downloaded from the Air Quality and MeteorologicalData Sharing Platform(https:/
6、all data were processed using the Tidyverse package in R software.The semiva-riogram values and their scatter plots of air pollutants surveillance and distance were estimated in each surveillance stations using thegstat package,and the semivariogram was fited using the scatter plot.The semivariogram
7、 was cross-checked using the actualsurveillance data,and the air pollutant concentrations were predicted in Jiangsu Provincial Center for Disease Control and Preventionand 13 city-level centers for Disease Control and Prevention in Jiangsu Province using the ordinary kriging interpolation method on
8、Jan-uary 2021.Results R package-based ordinary kriging interpolation method was effective to estimate the concentrations of multiple airpollutants,and Pearson correlation tests of semivariograms of each air pollutant showed significant correlations(all P values 0.01).The correlation coefficient(r)be
9、tween predictive and actual values of each air pollutant was 0.93 95%confidential interval(CI):(0.89,0.95)for PM2.5,0.83 95%CI:(0.75,0.88)for PMio,0.61 95%CI:(0.46,0.72)for S02,0.71 95%CI:(0.59,0.80)for NO2,0.60 95%CI:(0.45,0.72)for 0,and 0.66 95%CI:(0.52,0.76)for CO,respectively.Conclusions The gst
10、at package in R software is highly effective to achieve the calculation of kriging interpolation,and is reliable forassessment of exposure to air pollution,which provide insights into assessment of human exposure to air pollution.Keywords:Air pollution;Environmental exposure;R package;Kriging interp
11、olation空间插值法是在已知空间上离散点(X,Y)的某种属性(如PM2.5浓度)观测值Z,=Z(X,Y,)的条件下,估计空间上任意一点(X,Y)属性值的方法),在环境暴露评估中得到广泛应用 2 6 。克里金插值法作为一种空间插值法,经过多年的发展和优化,衍生出普通克里金插值法、协同克里金插值法、泛克里金插D01:10.13668/j.issn.1006-9070.2023.04.013基金项目:江苏省医学创新团队(CXTDB2017012)作者简介:汤文斌(198 2 一),男,江苏常州人,副主任医师,主要从事环境卫生工作425JiangsuJPrevMed,Vol.34,No.4江苏预防
12、医学2 0 2 3年7 月第34卷第4期值法、回归克里金插值法、析取克里金插值法等 7 ,从而适应各种复杂情况。普通克里金插值是对周围的测量值进行加权以预测未测量位置的值 8 。克里金插值法在暴露评估中逐步得到应用,R语言被广泛用于数据处理、统计、分析,目前系统介绍R语言实现克里金插值的研究较少。本文以江苏省各市环境污染物监测站点监测数据为例,基于R语言全面、系统地介绍克里金插值的理论及计算过程,同时使用遍历循环批量实现污染物交叉验证和暴露评估,为环境暴露评估提供技术支撑。1材料与方法1.1数据来源江苏省2 0 2 1年1月份各辖市区环境污染物监测站点的监测数据来源于空气质量与气象数据分享平台
13、(https:/q u o t s o f t.n e t/a i r/)。对原始数据进行清洗,并按照各监测站点进行分类汇总,得到2021年1月各监测站点名称、经纬度以及各污染物(PM2.5、PM 1o、SO 2、NO 2、0,、CO)平均浓度。1.2软件及工具包R4.2.3,Rstudio-2023.03.0,tidyverse-2.0.0,gstat-2.1,sp-1.6。t i d y v e r s e 是一个集合包,其中dplyr和tidyr包用于数据清洗、变形、筛选、汇总等,purrr包用于遍历循环,批量处理数据;gstat包用于时间和空间地质统计建模、预测和模拟,是空间插值计算主
14、要的包;sp包用于空间数据的处理。N1.3普通克里金插值计算算公式:Z(g)=入,Z(s),其中Z(s,)为第i个位置处的测量值;入,为第i个位置处的测量值的权重;s。为预测位置;N为测量值数。权重取决于测量点之间的距离、预测位置及测量点的整体空间排列。本文以PM2.5为例,展示普通克里金插值计算过程,后用遍历循环对各污染物批量进行插值计算。1.3.1半变异函数计算使用sp包中“coordinates”函数,将经度和纬度设置空间坐标并创建空间对象,数据表转换成“SpatialPointsDataFrame”类,再使用gstat包中“variogram函数计算各监测站点之间的半变异函数值,并绘制
15、距离与离差平方和的散点图,代码见图1。1.3.2拟合变异函数使用gstat包中“vgm函数生成变异函数模型,通过观察距离与离差平方和的散点图,确定自相关关系与距离之间的拟合模型,估算出偏基台(pstill)初始值,块金(nugget)值,变程(rang)值;通过使用gstat包中“fit.variogram函数调用上述计算得到的半变异函数值、变异函数模型拟合变异函数,代码见图2。1.3.3交叉验证使用Jk折交叉验证(K-fold cross-validation)对拟合的变异函数进行验证,将k份样本中的(k-1)份作为训练样本,剩余的1份作为验证样本,重复k次。gstat包中的“krige.c
16、v”函数完成交叉验证,函数的nfold大为k参数,将结果通过“as.data.frame函数转换成一个包含预测值、预测值方差、实际值、残差、z统计量(残差除以克里金标准误)等的数据框;对预测值和实际值采用Pearson相关性检验确定相关性,代码见图3。setwd(D:/R语言实现克里金插值)#设置工作目录pollutant-openxlsx:read.xisx(数据导出/江苏2 0 2 1年1月污染物平均.xlsx)#读入读入数据pollutant_pm2.5-pollutantsp:coordinates(pollutantpm2.5)经度+纬度#设置空间坐标并创建空间对象pollutant
17、_pm2.5_var-gstat:variogram(PM2.5-1,pollutant_pm2.5)#计算各监测站点之间的半变异函数值plot(pollutant_pm2.5_var)#绘制距离与离差平方和的散点图图1半变异函数计算代码pollutantpm2.5_vgm-vgm(psill=42,model=Gau,nugget-18,range=1.3)#生成变异函数模型pollutant pm2.5_fit.fit.variogram(object=pollutant pm2.5_var,model=pollutant_pm2.5_vgm)#拟合变异函数plot(pollutantpm
18、2.5_var,pollutant_pm2.5_fit)#拟合变异函数可视化图2拟合变异函数代码pollutant_pm2.5_cv%ias_tibbleo)#转换成数据框cor.test(pollutant_pm2.5_cvSvarl.pred,pollutantpm2.5_cvSobserved)#计算相关系数图3交叉验证与相关性检验代码1.3.4插值估算利用2 0 2 1年1月各监测点监测数据,应用克里金插值法,对江苏省疾控中心及13个地级市疾控中心住地2 0 2 1年1月的各污染物浓度进行预测。首先读人这14个单位地点的经纬度信息,使用sp包中的“coordinates函数,按照经纬度
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 语言 实现 普通 克里金插值法 空气污染 暴露 评估 中的 应用
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。