数据驱动下的传染病大流行期间大城市交通运行状况研究.pdf
《数据驱动下的传染病大流行期间大城市交通运行状况研究.pdf》由会员分享,可在线阅读,更多相关《数据驱动下的传染病大流行期间大城市交通运行状况研究.pdf(10页珍藏版)》请在咨信网上搜索。
1、2024.3,4(2)|智能交通与数字化数据驱动下的传染病大流行期间大城市交通运行状况研究曾恬1,罗斯达1,2,邵春福3(1.北京交通大学交通运输学院,北京,100044;2.北京交通大学综合交通运输大数据应用技术交通运输行业重点实验室,北京,100044;3.新疆大学交通运输工程学院,新疆 乌鲁木齐 830049)摘要:新型冠状病毒肺炎是近百年来人类遭遇的影响范围最广的全球性大流行病,探究新冠疫情期间不同城市交通运行状况的演变规律,对当前传染病大流行情境下的交通运行至关重要,并对未来类似情形下的城市交通治理具有借鉴作用。城市交通运行状况可由交通健康指数、拥堵延时指数等数据来表征,因此本文收集
2、疫情放开后十个大城市近一个月的拥堵延时指数、平均车速和交通健康指数等数据,通过相关性分析、线性回归、kmeans聚类分析等方法,从多个角度探究城市交通健康指数与拥堵延时指数或平均车速之间的关系,据此采用拥堵延时指数来研究各城市交通运行状况。进而基于拥堵延时指数将研究时段划分为疫情影响期、疫情稳定期、复工复产期、春节影响期这四个阶段。并在早晚高峰、疫情、春节以及跨年夜等多种情境下,从工作日和节假日多方面挖掘各城市在疫情放开影响下交通状况变化的异同点。结果表明,在疫情放开和春节假期等多种复杂因素的影响下,交通健康指数仍能由拥堵延时指数或平均车速线性表征,交通健康指数存在一定程度的冗余,用拥堵延时指
3、数等更易获取的数据就能够描述城市的交通运行状况。此外,疫情消退过程中,工作日早晚高峰出行的不均衡性较小,而节假日早晚高峰出行的不均衡性较大,达到 40%。关键词:城市交通;交通运行状况;聚类分析;拥堵延时指数;后疫情时代Analysis of traffic conditions in big cities during the pandemic:a datadriven approachZENG Tian1,LUO Sida1,2,SHAO Chunfu3(1.School of Traffic and Transportation,Beijing Jiaotong University,B
4、eijing 100044,China;2.Key Laboratory of Transport Industry of Big Data Application Technologies for Comprehensive Transport of Ministry of Transport,Beijing Jiaotong University,Beijing 100044,China;3.School of Traffic and Transportation Engineering,Xinjiang University,Urumqi 830049,China)Abstract:CO
5、VID-19 is a global pandemic with the broadest impact on human experience in the past 100 years.Exploring the changes of traffic operation in different cities during the COVID-19 epidemic is crucial for traffic operation under the current epidemic situation,which can provide reference for urban traff
6、ic management under similar situations in the future.Urban traffic operation can be character中图分类号:U491.1 文献标志码:A 文章编号:2097-017X(2024)02-0033-10DOI:10.3969/j.issn.2097-017X.2024.02.007收稿日期:2023-12-07基金项目:中央高校基本科研业务费专项资金项目(2021RC273);国家自然科学基金资助项目(72101017)。第一作者简介:曾 恬(2000),女,硕士研究生。研究方向:MaaS下的公交线网优化。通
7、信作者简介:罗斯达(1992),男,博士,教授。研究方向:MaaS下的网络优化、智能网联-无人驾驶交通管控、数据挖掘等。33ized by traffic health index,congestion delay index and other data.Hence,this paper collects the data of traffic delay index,average speed and traffic health index of ten major cities for nearly a month in the post COVID-19 period.Through
8、 correlation analysis,linear regression,k-means clustering analysis and other methods,this paper explores the relationship between traffic health index and congestion delay index or average speed from multiple perspectives.Based on the congestion delay index,the study period is divided into four sta
9、ges:the epidemic impact period,the epidemic stability period,the resumption of work and production period,and the Spring Festival impact period.The differences and similarities of traffic conditions in different cities are explored in different situations such as rush hour,the epidemic and the Sprin
10、g Festival.The results show that under the influence of epidemic and the Spring Festival,the traffic health index can still be linearly represented by the congestion delay index or the average vehicle speed,which means that the traffic health index has a certain degree of redundancy.We can use more
11、accessible data to describe the traffic operation of the city,such as the congestion delay index.Whats more,the epidemic has a great impact on the imbalance of travel in the morning and evening peak hours during holidays.That means,in the post COVID-19 period,travel congestion in the morning and eve
12、ning peak hours during holidays varies,even reaching 40%.Key words:urban traffic;traffic conditions;k-means clustering algorithm;traffic congestion index;post COVID-19 period引 言新型冠状病毒肺炎是近百年来人类遭遇的影响范围最广的全球性大流行病,2022 年 12 月,中国新冠疫情防疫政策全面放开,伴随着健康码、行程码取消等一系列措施,我国的新冠疫情防控进入了新阶段。流行病的恢复会影响城市交通的运行状况,例如在流行病传播的
13、高峰时段,人们倾向于选择私家车出行1,公共交通的使用率大幅降低2-4。另一方面,多源交通数据在城市交通运行状况监测方面的研究越来越广泛5-8 。高德和百度等公司在 2014 年推出了交通大数据监测平台,基于交通出行数据,实时监测中国主要城市交通运行状态9。在疫情全面放开的影响下,不同城市的交通运行状况可能有所差异10-12 ,相关的交通管控措施需要因地制宜13。因此本文通过采集百度和高德平台的交通健康指数和拥堵延时指数等数据,运用相关性分析、回归分析、k-means聚类分析等方法,探究各大城市交通运行状况的变化趋势,总结不同城市交通运行状况的变化特征和异同点14。未来新冠、流感、支原体感染等疾
14、病亦或影响城市正常运转,而决策者通过公网可以查到的相关数据,采用本文的分析方法为相关决策提供参考,提前预测大规模流行病感染的前、中、后期对城市交通可能产生的影响。1数据说明本文统计了疫情全面放开后 2022年 12月 23日到 2023 年 1 月 20 日,北京、上海、武汉、成都、昆明、厦门、苏州、南京、广州、呼和浩特这 10 个大城市的交通健康指数(hi)、拥堵延时指数(di)、路网平均车速(vi)等数据;拥堵延时指数9 和平均车速来源于百度、高德这两大交通出行大数据平台的开放数据;而交通健康指数是城市交通诊断的综合性评价指标,涵盖拥堵延时指数、路网高峰拥堵路段里程比等9 项指标15,来源
15、于高德大数据平台的中国主要城市交通健康榜的开放数据。计算研究时段内各城市拥堵延时指数和交通健康指数的平均值、方差等数据,发现拥堵延时指数和交通健康指数反映出的特征大致相同,这表明拥堵延时指数和交通健康指数在评估城市交通状况时具有一定的相似性和关联性。北京、武汉的交通拥堵情况较为严重,拥堵延时指数均值达到 1.7,交通健康指数均值为 50;而厦门、苏州、呼和浩特的交通拥堵情况较为良好,拥堵延时指数均值在 1.3 以下,交通健康指数达到 70。2交通健康指数分析交通健康指数涵盖了拥堵延时指数、路网高峰拥堵路段里程比等 9 项指标,是城市交通诊断的综合性评价指标。但交通健康指数与拥堵延时指数、34数
16、据驱动下的传染病大流行期间大城市交通运行状况研究 曾恬 等平均车速之间存在怎样的关系,能否用更为简单直观的变量来表征交通健康指数等问题值得探究。因此本章采用相关性分析和线性回归等方法,探究交通健康指数和拥堵延时指数、平均车速之间的关系。2.1正态性检验线性回归需要因变量大致服从正态分布,而夏皮罗-威尔克(Shapiro-Wilk)检验法16常用于检验小样本容量中变量是否服从正态分布,用于检验的 W值由下式计算:W=()i=1naixi2i=1n()xi-X2(1)式中 xi为待检验数据,ai是样本量为 n时所对应的系数,X为待检验数据的平均值。当 W 值越接近于1且检验的 p值大于 0.05时
17、,则认为变量服从正态分布。因此基于夏皮罗-威尔克检验法对交通健康指数进行正态性检验,判断交通健康指数是否基本服从正态分布。根据表 1中各城市交通健康指数正态性检验的结果可知,p 值基本大于 0.05,说明交通健康指数呈正态分布的原假设。并且在 p 值小于 0.05 的城市中,通过观察偏度、峰度和正态 Q-Q 图发现与正态分布较为相似,因此可认为在样本城市中交通健康指数近似服从正态分布。2.2相关性分析皮尔逊相关性系数 r常用于度量两个变量之间的相关性,可由下式计算:r=i=1n()Xi-X()Yi-Yi=1n()Xi-X2i=1n()Yi-Y2(2)皮尔逊相关性系数 r介于1与 1之间。其中,
18、Xi和Yi为待检验数据,Xi和Y为待检验数据的平均值。一般认为皮尔逊相关性系数的绝对值大于 0.6时,两个变量之间存在强相关性。通过绘制散点图,发现交通健康指数和拥堵延时指数或平均车速的变化存在类似的特征,如图 1所示,因此通过计算皮尔逊相关性系数探究其相关性。结果如表 2 所示,发现交通健康指数与拥堵延时指数或平均车速之间均具有显著的相关性,p 值均小于 0.05。在样本城市中,交通健康指数与拥堵延时指数之间的皮尔逊相关系数均值为-0.777,存在显著的负相关关系;而交通健康指数与平均车速之间的皮尔逊相关系数均值为 0.747,存在显著的正相关关系。即拥堵延时系数越大,平均车速越小,交通健康
19、指数越低。表 1交通健康指数正态性检验Tab.1Traffic health index normality test城市北京上海武汉成都昆明厦门苏州南京广州呼和浩特偏度0.2480.2910.277-0.58-0.2810.6210.5390.278-0.2030.260峰度-1.534-1.132-1.455-1.088-0.856-0.338-0.507-0.957-1.468-0.981W 值0.8860.9360.9050.8690.9570.9360.9490.9550.9150.933ShapiroWilk检验 p值0.0160.1600.0370.0080.4330.1610.
20、2950.3930.0610.145图 1交通健康指数与拥堵延时指数和平均车速的变化趋势Fig.1Changes in traffic health index,congestion delay index,and average vehicle speed表 2交通健康指数的皮尔逊相关性系数Tab.2Pearson correlation coefficient table of traffic health index城市北京上海武汉成都昆明厦门苏州南京广州呼和浩特平均值拥堵延时指数-0.921-0.767-0.876-0.768-0.836-0.649-0.677-0.781-0.779
21、-0.713-0.777平均车速0.9130.7060.8620.7860.8230.5960.5860.7090.7710.7200.747 35此外,在交通健康指数越低的城市中(例如北京、武汉),城市交通健康指数与拥堵延时指数之间的相关性越大,达到 0.9;而在交通健康指数较高的城市中(例如厦门、苏州),城市交通健康指数与拥堵延时指数之间的相关性较低,约为 0.65。2.3线性回归与误差估计线性回归是利用线性回归方程的最小平方函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析,常用于确定两种或两种以上变量间相互依赖的定量关系。因此在样本城市中分别用拥堵延时指数和平均车速对交通健康
22、指数进行线性回归拟合,统计其回归系数、显著性等关键参数,探究交通健康指数与拥堵延时系数或平均车速之间能否用如下的线性关系进行表示:hi=didi+di(3)hi=vivi+vi(4)式中 hi表示城市i的交通健康指数;di表示城市i的拥堵延时指数;vi表示城市i的平均车速;di,di,vi和vi为线性回归的系数。由表 3和表 4中线性回归的结果可知,在样本城市中拥堵延时指数和平均车速与交通健康指数之间均存在一定的线性关系。拥堵延时指数和交通健康指数的 R 方均值为 0.59;平均车速和交通健康指数的 R 方均值为 0.55,并且在各大城市中,显著性均小于 0.05。说明交通健康指数能够由拥堵延
23、时指数或平均车速用简单的线性关系表示。在线性回归中,存在部分城市回归的 R 方值较低的情况,针对这些城市采用误差估计的方法进一步判断线性回归的有效性。以拥堵延时指数的线性回归结果为例,厦门线性回归得到的 R方较低,约为0.4。因此在研究时段内随机选取 70%的数据作为训练集,用剩下的 30%作为测试集,判断用训练集拟合出来的线性模型是否具有较好的预测效果。根据 70%的数据回归结果,厦门市的交通健康指数(h1)可以由拥堵延时指数(d1)来表征,并通过下式计算得到:h1=-12.455d1+89.795(5)按照式(5)计算出剩余 30%数据的预测值,并与真实值对比,计算预测的误差,误差由预测值
24、和真实值的差与真实值的比值计算得到。由表 5 可知,预测值与真实值之间的相对误差均在 3%以内,平均误差为 1%。说明即使在 R 方较小的城市中,采用线性回归的方式来计算交通健康指数误差较小,能够保证预测的准确度。通过相关性分析、线性回归及误差分析等多个统计手段,验证了拥堵延时指数或平均车速与交通健康指数之间存在显著的线性关系,用拥堵延时指表 3拥堵延时指数与交通健康指数的线性回归Tab.3Linear regression between congestion delay index and traffic health index城市北京上海武汉成都昆明厦门苏州南京广州呼和浩特平均值R方0
25、.8470.5880.7670.590.6990.4210.4580.610.6070.5080.609线性相关系数变量系数di-25.520-27.132-29.966-22.856-15.528-12.925-16.016-25.299-30.514-17.699-22.345常数di92.276105.003101.51995.19990.18590.2393.503104.072103.113100.58297.568显著性(p值)变量0.0000.0000.0000.0000.0000.0010.0010.0010.0000.0000.000常数0.0000.0000.0000.00
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 驱动 传染病 流行 期间 城市交通 运行状况 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。