基于统计分析的公共自行车服务系统评价模型研究.pdf
《基于统计分析的公共自行车服务系统评价模型研究.pdf》由会员分享,可在线阅读,更多相关《基于统计分析的公共自行车服务系统评价模型研究.pdf(53页珍藏版)》请在咨信网上搜索。
1、基于统计分析的公共自行车服务系统评价模型研究摘要本文针对温州市鹿城区公共自行车管理中心提供的数据,首先对所给数据进 行预处理,建立了相关统计模型,运用SPSS20.0、matlab等软件进行统计分析,最后应用关联度分析法对系统进行评价,并提出改进建议。针对问题一:在已处理好的数据基础上,建立了频率与频数、用车时长的统 计模型,利用SPSS软件分别统计各站点20天中每天及累计的借车及还车频次,得 到每天和累计的借车和还车频次(见表五和表六);并对所有站点按累计的借车 和还车频次排序(见表七和表八);对每次用车时长的分布情况进行统计分析,画出其分布图(见图一和图二),由图可知:每天用车时长分布形状
2、非常相似且 近似服从/分布。针对问题二:在已处理好的数据基础上,建立了使用公用自行车的不同借车 卡数量的统计模型,利用SPSS统计20天中每天使用不同借车卡数量,其中最大 的为第20天的19885;统计了每张借车卡累计借车次数的分布图(见图三),对 图形分析可得:借车次数在10次以内的占54.86%,借车次数在10至30次占 35.88%,借车次数在30至50次占7.51%,借车次数在50以上占1.75%,最大 借车次数高达182次。针对问题三:根据问题一的分析,已给站点累计所用公共自行车次数最大的 一天是第20天。对于第一小问:利用第20天数据,运用floyd算法求得两站点 间最短时间,将站
3、与站间的距离定义为两站间的最短时间与自行车速度之积,同 时考虑到了速度和时间的随机误差影响;利用距离的定义,通过matlab计算得 两站点最长距离为:675,最短距离为:0.08。利用问题一中的频数模型,对借还 车是同一站点且使用时间在1分钟以上的借还车情况进行统计,得借车频次表(见表十一)和用车时间分布图(见图四)。对于第二小问:根据问题一的统计,第20天的借车和还车频次最高的站点分别为42(街心公园)和56(五马美食林),利用SPSS统计出两站点借、还车时刻和用车时长的分布图(见图五,图六,图 七),由图形分析可知:借还车的高峰期与人们上下班的时间非常吻合,在借还 车时间上大体都在一小时以
4、内。第三小问:将第20天数据从6点到22点每半小 时作为一时段,分别统计各站点各时段借还车频数,利用matlab编程求出借还 车高峰时段(见表十二),并对具有借车高峰时段与还车高峰时段的站点进行归 类。(见表十四)针对问题四:根据前三个问题的统计结果,结合公共自行车服务指南,确定 评价公共自行车服务系统站点设置和锁桩数量的配置的主要指标有:借车频数、还车频数、可借比例、可还比例、锁桩数目,建立了基于灰色关联分析法和聚类 分析的公共自行车服务评价模型,得到评价结果:180个站点分成有优劣之分的 三个类(见表十五)。针对问题五:通过查阅相关资料知:公共自行车的其他运行规律主要是借还 车时间有限制,
5、用车时间集中在短时间内等。针对此问题提出了相关建议。关键词:公共自行车服务系统统计分析灰色关联度分析聚类分析一、问题重述1.1 问题背景公共自行车作为一种低碳、环保、节能、健康的出行方式,正在全国许多城 市迅速推广与普及。在公共自行车服务系统中,自行车租赁的站点位置及各站点 自行车锁桩和自行车数量的配置,对系统的运行效率与用户的满意度有重要的影 响。1.2 问题提出了解公共自行车服务模式和使用规则的基础上,根据附件提供的数据,建立 数学模型,讨论以下问题:1.分别统计各站点20天中每天及累计的借车频次和还车频次,并对所有站 点按累计的借车频次和还车频次分别给出它们的排序。另外,试统计分析每次用
6、 车时长的分布情况。2.试统计20天中各天使用公共自行车的不同借车卡(即借车人)数量,并 统计数据中出现过的每张借车卡累计借车次数的分布情况。3.找出所有已给站点合计使用公共自行车次数最大的一天,并讨论以下问 题:(1)请定义两站点之间的距离,并找出自行车用车的借还车站点之间(非 零)最短距离与最长距离。对借还车是同一站点且使用时间在1分钟以上的借还 车情况进行统计。(2)选择借车频次最高和还车频次最高的站点,分别统计分析其借、还车 时刻的分布及用车时长的分布。(3)找出各站点的借车高峰时段和还车高峰时段,在地图上标注或列表给 出高峰时段各站点的借车频次和还车频次,并对具有共同借车高峰时段和还
7、车高 峰时段的站点分别进行归类。4.请说明上述统计结果携带了哪些有用的信息,由此对目前公共自行车服 务系统站点设置和锁桩数量的配置做出评价。5.找出公共自行车服务系统的其他运行规律,提出改进建议。二、问题分析题目提供了 20天公共自行车借车和还车等原始数据,本文的关键就是通过 分析处理所给数据,建立数学模型来研究公共自行车服务系统,并对公共自行车 服务系统进行评级及提出改进建议。2.1问题一分析要统计各站点20天中每天和累计的借车和还车频次,查阅资料知网,频数 为频率和频数,对于借车与还车频数,可引入0-1变量表示各站第,天借车和还 车在,次记录中出现的频数,各站每天和累计的借车频数就是借出车
8、站号在每天 出现的次数和总天数的借车频数和,各站每天的借车频率是借出车站号在每天出 现的次数与每天的有效数据,累计的借车频率是累计借车的频数比上总有效数 据,对于借车每天及累计的频数类似,从而可建立相应的统计模型。根据以上分 析,可统计出各站点20天中每天和累计的借车和还车频次,进而可对所有站点 累计的借车和还车频次排序。分析每次用车时长的分布情况,可运用相关软件将 分布情况作出。2.2问题二分析要统计20天每天使用公共自行车的不同借车卡的数量,对于各天的借车人 数相当多,为此先用相关软件对有效数据进行处理,即将重复的借车卡,累计到 不同借车卡的一行中,可得到没有重复的不同借车卡数据,引入0-
9、1变量表示第,张卡第/个数据中出现的情况,累计求和,就可得到各天不同借车卡的数量,即得相应统计模型,再运用相关软件分析每张借车卡累计次数的分布情况。2.3问题三分析(1)由于站点之间的实际距离很难得到,且城市里人流量较大,自行车行 驶速度不可能很大,应比较均匀,所以定义两站点之间的距离,可根据物理中距 离与时间和速度的关系定义距离,其中时间的获取可通过数据中所给的站与站之 间的用时加以处理后得到。该定义的距离会应不同的骑车速度和时间,导致两站 点距离不同,因此速度和时间需要引进误差,且将两相同站点的距离定义为0,为此可得到距离的定义。对于借还车是同一站点且用时一分钟以上的借还车情况 直接利用S
10、PSS进行统计即可得出相应结果。(2)根据问题一得到结果,可找到所有站点使用自行车次数最大一天,借 车频次高和还车频次最高的站点,根据相应站点的数据,可应用相关软件将各站 点的借、还车时刻的分布及用车时长的分布求出。(3)题中给出数据的借车还车时间段为6:00-21:00,要求各站点借车还车 的高峰时段,可对总的时间段进行划分,考虑到数据量以及统计的精确度,可采 用一定时间间隔作为一个时间段,分别统计各个站点在每个事件段内的借车频数 以及还车频数,则最高借还车频数对应的时间段即为高峰时段,进而能得出高峰 时段各站点的借车频次和还车频次,此处统计工作量可能较大。再对其整体分析,即能得到具有共同借
11、车高峰时段和还车高峰时段的站点的归类情况 2.4问题四分析要对目前公共自行车服务系统站点设置和数量的配置做出评价,要根据前几 问统计的数据,找出相应的指标,根据问题一,可让借车频数和还车频数作为其 中指标,从数据的初步分析来看,借车、与还车频数可能大,说明车流量比较多,从这方面,也可根据题目所提供的站点地理位置,可以知道各个站台的得可借比 例(可借车位比上总车位)和可还比例(可借车位比上总车位),作为其中指标,对于数量的配置,根据各站锁桩的数量等作为其中指标,为此可得到相应指标对 自行车服务系统进行评价,运用灰色关联分析法,求出各个站点的关联度,进行 排序,可再用SPSS聚类分析分成三类,求出
12、每一类的均值,从而进一步确定出 类别间的优劣。2.5问题五分析要找出自行车服务系统的其他运行规律并提出改进意见,要先对问题中所有 数据的一个时间分布情况、借车高峰、还车高峰、以及站点中桩位设置的合理性,进行改进。而改进的方法可能从现有数据和系统流程不能解决,因此可通过查找 其他服务系统中号的服务规则进行改进。三、符号说明X(z=l-181)第,个站的频数/(%=1,2 20)第天数据记录的有效总数(剔除后的数据)第6个时间在第j次记录中的出现次数乩第i张卡出现的频数d.第,个站到第j个站的距离%第i个站到第j个站的所用最短时间占2时间合成误差速度随机误差Pi第i个站点的频率4第左天借记卡总数项
13、卜=i,2.yjV第i个站到第j个站在数据中出现的次数 人骑自行车的平均速度第i个站到第j个站的时间集中数据第个j站到第i个站的时间集中数据A,B测量数据时的不确定度四、模型假设1、以自行车车站号做为借车车站的唯一标识2、附件中所给的数据能准确描述公共自行车系统管理与运营状况3、自行车行驶的过程中,以匀速行驶,行驶过程中不会停留4、异常数据的剔除,不影响数据的整体性五、数据预处理观察整个数据发现有许多异常数据,对任意一天的数据统计发现共提供了 181个站点,但是108号站点是空缺值。根据用车时间、用车方式、换车锁桩号、温州鹿城公共自行车服务指南等信息剔除一些不合理数据。剔除部分用车时间在0 2
14、分钟:对于数据中用车时间。的,借车者从用一车站借出、同一车站还回,而且借 还车桩号基本相同,其可能原因是车辆发现自行车有问题就立即还回和在借车成 功后20秒内自行车未推出,则20秒后自动锁上(温州鹿城公共自行车服务指南),这样的情况自行车都属于没有使用;对于数据用车时间1和2的,可剔除同一车 站提出同一车站还回,可能原因为车有问题立即还回,车是没有使用的,系统有 计算出了该类车的用车时间,因此可以剔除这样的情况的数据,但该数据中有借 还车地点不一样不能剔除,因为可能两站之间距离很小能在1 2分钟左右完成。以下表(表一)为例:表一:用车时间为0 2的数据借出车站号借车锁还车车站号还车锁用车时间用
15、车方式94994180会员卡借车169816980会员卡借车1351341会员卡借车42442101会员卡借车191919192会员卡借车5515512会员卡借车 剔除部分用车时间在3 5分钟:根据温州鹿城公共自行车服务指南无法借、还车处理办法第四条,即借车时 听到语音提示“通讯故障暂停使用”,请等待3 5分钟后,换桩借车。可以知 道在同一车站提出同一车站还回借还车桩一样的,且用车时间在3 5分钟内这 样的数据,自行车可能是无法使用,但系统又在计算用车计时,对于这样的数据 可以剔除。以下表(表二)为例:表二:用车时间为3 5的数据借出车站号借车锁还车车站号还车锁用车时间用车方式1311313会
16、员卡借车18120181203会员卡借车492049204会员卡借车702070204会员卡借车11115会员卡借车6416415会员卡借车 剔除还车桩桩号为。的数据:数据中有极少数的车桩号为0,而且车桩号为0的同时,用车时间也为0,该原因可能为借车者没有还车而导致或该桩号的车被盗,这样的数据是没有意义 的,理应剔除。以下表(表三)为例:表三:还车桩桩号为0的数据借出车站号借车锁还车车站号还车锁用车时间用车方式8211000会员卡借车9914000会员卡借车 剔除用车方式为还车故障的数据:在所有数据中有极少的数据借车时间和还车时间差值并不等于用车时间,在 用车方式上写了还车故障,这一部分数据也
17、会影响结果因当剔除,以下表(表四)为例:表四:用车方式为还车故障统计表借出车站号借车锁还车车站号还车锁用车时间用车方式444780还车故障711444190还车故障 剔除数据还车车站号不存在的数据:根据温州鹿城公共自行车站点地图可以知站号最大号为6055,但有些数据 还车车站号不存在,该类数据有2个分别是在第5天中的借出车站号为9,还车 车站号为29999(不存在)和第7天中借出站号为43,还车车站号为29999的,这类型的数据对研究没有意义应当剔除。剔除调试站的数据在20天的数据整理中,发现有4天中出现了调试站,这些调试站分别在第 8,9,15,16天中。调试站借车桩位和还车桩位都为1000
18、,而且一直都在桩位上用 车时间为0,因此对数据的研究没有意义应当剔除。剔除的所有数据详见附录1。六、模型的建立与求解6.1 问题一的解答6.1.1 模型一的建立需要统计各站点20天中每天和累计的借车频次,查阅资料知频次为频率和 频数也,分别建立频率与频数的模型。设七.为0-1变量,即=ri第i站在第j次记录中出现Xij=O 第i站在第j次记录中不出现Z,为第4个时间在第/次记录中的出现次数,/为0T变量用车时间为4在第j次记录中出现f,ij=0 用车时间为4在第j次记录中不出现建立模型一:n Nk每天各站的频数:y=26 勺J=i=l j=20n 毕 20各站累计的频数:y-=X 2L i=-
19、n,j=-NkZ=1 j=l L k=l每天各站的频率:=120,i=1)各站累计的频率:p=(z=小k=i用车时长:之九j=l j=l6.1.2模型一的求解借、还车频次的计算根据题目所给数据,代入以上模型,利用SPSS进行求解,得各站20天中每 天及累计的借车和还车频次,部分数据见下表(表五,表六),具体数据见附录 20表五:20天中每天和累计的借车频次站点编号借车频次 借车频次借车累计频次第1天频 数第1天频率 第20天 频数第20天 频率累计频数累计频率1850.00253 840.002143760.0006421020.00303 1060.0027014150.0007031700
20、.00505 1770.004517040.0011942270.00674 2780.0070810850.0018451290.00383 1360.003465450.00092 1771230.00365 2590.0065933060.00559178520.00154 1010.0025712840.002171792840.00843 3700.0094350920.0086180480.00143 1490.0037919450.00329181590.001751700.004321310.00361表六:20天中每天和累计的还车频次站点编号还车频次 还车频次还车累计频次第1
21、天频 数第1天频 率 第20天频 数第20天频 率累计频数 累计频率1870.00258 800.0020415630.0026521050.00312 1010.0025715920.0026931670.00496 1710.0043626740.0045342160.00641 2880.0073451700.0087551440.00428 1390.0035424210.00410 1771230.00365 2590.0066033060.00560178520.00154 1010.0025712840.002171792840.00843 3700.0094350920.008
22、62180480.00143 1490.0038019450.00329|181|59 10 00175|170|O 00433|2131|O 00361|累计频次的排序对以上统计的所有站点累计的借车频次与还车频次,根据频率或频数中的其 中一个进行排序,因为频率的计算会有小数的误差,为了方便统计,用频数进行 排序,排序结果见下表(表七,表八),具体见附录2。表七:累计借车频次的排序序号站点号借出车站频数142街心公园11513256五马美食林11151319开太百货9192463体育中心西9031 17790拉菲度假酒店54217886测试点391179162望江路广化桥路口282180153
23、妇女儿童中心254由上表可知,累计借车频数最,t的站点号为42(街心公园),借车频数为11513,最小的站点为153(妇女儿童中心),借车频数为254。其差异原因主要 是由于地理位置的不同,街心公园在地图中明显位于交易繁华的位置,周围有商 场有酒店,借车数相对较多,而妇女儿童中心周围比较空旷人流活动少。表八:累计还车频次的排序序号站点号借出车站频数156五马美食林11509242街心公园11375319开太百货9313463体育中心西9306 17890拉菲度假酒店568179162望江路广化桥路口299180153妇女儿童中心272由上表可知,累计还车频次最高的站点号为56(五马美食林),还
24、车频数为 11509,最小的站点为153(妇女儿童中心)还车频数为272。其差异原因主要是 地理位置的不同,五马美食林在地图中查看可知,其周围是社区和商城人流密集。每次用车时长的分布对于每次用车时长的分布情况,根据题目中数据,用SPSS统计出分布时间 对应的频数可画出用车时长的分布直方图。随机抽取20天中某几天用车时间与 20天累积数据用车时间的分布对比图(图一,图二)。(20天每天的分布图及累 计分布图详见附录3)范十三大用华时间分布出方图第二天用年时间分布ff方图图一:第二天,第十三天时间分布图图二:第20天,20天累积时间分布图由图形分布情况可以看出:每一天和20天内用车时长的分布情况基
25、本相同,而且作出20天所有用车时长的分布情况,其状况也相同。因此分析用车时长可 以用20天内累计的数据。通过查找分布图可知,用车时长的分布近似服从/分 布。对分布情况观察发现时间基本集中在5 6。内,而超过1小时的用车时间却 很少。6.2问题二的解答6.2.1模型二的建立对于统计20天中各天不同借车卡的数量,将公共自行车每天的数据按借卡 号顺序排列,且将同种借卡号出现的次数累积起来,其累积的次数就是借记卡的 数量。假设a.为第,张卡出现的频数,4为第左天借记卡总数,为为0-1变量,=11 第i张卡在第j次记录中出现 为第i张卡在第j次记录中不出现建立模型二:Zk NkH/=ZE%(i j.凡
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 统计分析 公共 自行车 服务 系统 评价 模型 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【曲****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【曲****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。