基于深圳通刷卡数据的轨道交通客流与站点特征分析.pdf
《基于深圳通刷卡数据的轨道交通客流与站点特征分析.pdf》由会员分享,可在线阅读,更多相关《基于深圳通刷卡数据的轨道交通客流与站点特征分析.pdf(3页珍藏版)》请在咨信网上搜索。
1、总656期2023年第26期(9月 中)收稿日期:2023-03-22作者简介:陈玉如(1999),女,重庆人,硕士,研究方向为交通运输规划与管理。基于深圳通刷卡数据的轨道交通客流与站点特征分析陈玉如,王才雪(重庆交通大学交通运输学院,重庆 400074)摘要:为探究轨道交通客流与站点特征,基于Hadoop平台对深圳通刷卡数据进行清洗与筛选,然后从站点收入、进出站客流等不同维度进行特征分析,最后采用聚类算法进行站点聚类以挖掘刷卡数据的潜存信息。结果表明,深圳轨道交通网络客流分布不均衡,少数站点占据多数客流;地铁站点可分为居住区车站、居住办公组团车站、一般车站、交通枢纽区车站以及商业区车站5类,
2、站点聚类结果可为周边土地利用、车站发展规划等提供参考。关键词:轨道交通;交通大数据;刷卡数据;聚类分析中图分类号:U231.92文献标识码:A0 引言城市轨道交通是城市公共交通的重要组成部分,基于交通大数据对轨道站点进行分类研究有助于明晰当前轨道交通客流影响因素,厘清城市轨道交通与土地利用、区位特征等的互动关系,进而为城市规划及周边土地综合开发提供参考依据1-2。为此,本文基于深圳通刷卡数据,在进行基于线路视角、站点视角以及时间视角的客流特征分析后,通过K-means聚类分析进行站点分类,聚类结果可为城市综合发展提供参考。1 深圳通刷卡数据介绍及数据处理本文所用的交通大数据来自深圳市政府数据开
3、放平台的深圳通刷卡数据,支持格式为JSON,经接口调用后方可下载。下载的深圳通刷卡数据包含 2018 年8 月 27 日2018 年 9 月 1 日的样例数据信息,共计1 377 000条数据,其中站点缺失数据70 961条,故有效数据为1 266 039条,其中包含2018年8月27日数据1条,8月28日数据61条,8月29日数据155条,8月30日数据275条,2018年8月31日公交数据8 501条、轨道交通数据27 866条,9月1日公交刷卡数据447 708条,轨道交通数据781 472条。经数据清洗后,深圳通刷卡数据已不存在重复和缺失现象,但由于原始数据交易时间字段中包含年月及时刻
4、两部分内容,不利于数据提取,因此需通过数据分列将其分为日期和时间两个字段信息,方便后续对刷卡数据进行客流的时间特征分析。2 客流特征分析对客流特征进行分析有助于主动把握客流的流动规律,从而做好运营工作3。基础数据经过处理后,依据线路、站点以及时间维度对数据进行分类统计,分析时段选取数据相对完整的2018年9月1日,通过分析不同视角下的客流数据统计结果以得到细化的客流特征。2.1 基于线路视角的客流特征分析深圳市轨道交通线路有1号线、2号线、3号线、4号线、5号线、7号线、9号线以及11号线,不同轨道交通线路的客流量以及线路收入存在明显差异,见图1与图2。2.2 基于地铁站点视角的统计分析深圳轨
5、道交通线网共有8条线164个站点,各站点客流存在明显差异,具有明显的拖尾现象。轨道交通站点客流分布不均衡,少数站点承载着绝大部分的客出站客流进站客流1号线2号线3号线4号线5号线7号线9号线11号线78 46066 05437 08727 02069 87181 98132 80950 09873 86798 57327 22935 84922 99125 64823 41730 518180 000160 000140 000120 000100 00080 00060 00040 00020 0000客流量/人次进站客流出站客流图1 深圳市轨道交通线路客流量统计(1 d)4交通世界TRAN
6、SPOWORLD流量。各地铁站点因地理位置和周边开发强度不同,周边商业、办公、住宅等设施产生或吸引的客流有明显差异4。进出站客流排名前10的站点(见图3)占总客流量的比重为16.60%,其中,排名第1的深圳北站客流占总客流的比重为2.68%,占前10站点客流总量的15.54%。而进出站客流较少的车站大都位于新开的地铁线路 7号线、9 号线、11 号线以及 2 号线与 5 号线的个别站点,车站周边土地处于未开发状态,且缺乏接驳设施,因而临海、深湾等地铁站的客流明显少于其他车站。计算对比各车站的站点收入可知,深圳北站的收入最多,罗湖次之,同站点的进出站客流量相匹配。其中,收入排名前10的车站收入详
7、情见图4。2.3 基于时间视角的统计分析根据地铁进出站时间客流数据统计结果,在 9 月1 日上午,7:508:40 各站点进站客流人数均超过2 000人,在8:29时达到进站客流的峰值,进站客流数为2 565人次;出站客流高峰期集中在8:209:00,在8:46出站客流达到峰值3 482人次。相比之下,轨道交通进站客流的时间分布更均匀平缓,出站客流时间分布存在明显的峰值,自9:00之后,进出站客流保持相对动态稳定趋势,再无明显波峰。3 聚类分析对刷卡数据本身进行分析仅能得到相对浅显的客流及站点特征,如何基于站点信息及进出站客流量挖掘出数据的潜在价值值得深入研究。当前城市轨道交通车站分类没有统一
8、方法,大多以车站与地面相对位置、运营性质、站台形式等作为划分依据,不能较好地反映客观情况,而采用数据挖掘领域的聚类分析方法能较好地解决这类问题。通过选取站点客流及站点规模相关的聚类因子,运用聚类算法得到定量分析结果,并结合定性方法对聚类结果进行深入分析,形成的结论可为综合交通规划与管理提供支撑。K-means 聚类算法是一种迭代求解的聚类分析算法,该算法首先从数据集中随机选取k个数据作为初始的聚类中心,然后计算每个数据到初始聚类中心的距离,将数据按规则划分至各类别中,通过迭代更新聚类中心,直至算法收敛。K-means聚类算法的具体计算过程如下。1)初始聚类中心的选取。从给定数据集中随机选取k个
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 深圳 刷卡 数据 轨道交通 客流 站点 特征 分析
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。