电动自行车轨迹简化与自适应地图匹配算法.pdf
《电动自行车轨迹简化与自适应地图匹配算法.pdf》由会员分享,可在线阅读,更多相关《电动自行车轨迹简化与自适应地图匹配算法.pdf(28页珍藏版)》请在咨信网上搜索。
1、近年来,随着全球定位系统(globalpositioningsystem,GPS)的大范围应用,越来越多的电动自行车装配了GPS 传感器,由此产生的海量轨迹数据是深入了解用户出行规律、为城市规划者提供科学决策支持等诸多应用的重要基础.但是,电动自行车上普遍使用的价格低廉的 GPS 传感器无法提供高精度的定位,同时,电动自行车轨迹地图匹配过程因以下原因更具有挑战性:(1)存在大量停留点;(2)高采样频率导致相邻轨迹点的距离较短;(3)电动自行车可行驶的路段更多,存在大量无效轨迹.针对上述问题,提出一种可自适应路网精度的电动自行车轨迹地图匹配方法 KFTS-AMM.该方法融合基于分段卡尔曼滤波算法
2、的轨迹简化算法(KFTS),和分段隐马尔可夫模型的地图匹配算法(AMM).首先,利用卡尔曼滤波算法可用于最优状态估计的特性,KFTS 能够在轨迹简化过程中对轨迹点进行自动修正,使轨迹曲线变得平滑并减少了异常点对于地图匹配准确率的影响.同时,使用基于分段隐马尔可夫模型的地图匹配算法 AMM,避免部分无效轨迹对整条轨迹匹配的影响.此外,在轨迹数据的处理过程加入了停留点的识别与合并,进一步提升匹配准确率.在郑州市真实电动自行车轨迹数据的实验结果表明,KFTS-AMM在准确率上相对于已有的对比算法有较大的提升,并可通过使用简化后的轨迹数据显著提升匹配速度.关键词:地图匹配;轨迹简化;卡尔曼滤波;轨迹数
3、据分析;隐马尔可夫模型;停留点中图法分类号:TP18中文引用格式:王东京,刘继涛,俞东进.电动自行车轨迹简化与自适应地图匹配算法.软件学报,2023,34(8):37933820.http:/ Simplification and Adaptive Map Matching Algorithm for Electric BicycleWANGDong-Jing,LIUJi-Tao,YUDong-Jin(SchoolofComputerScienceandTechnology,HangzhouDianziUniversity,Hangzhou310018,China)Abstract:Witht
4、hewideapplicationofglobalpositioningsystem(GPS),moreandmoreelectricbicyclesareequippedwithGPSsensors.Massive trajectory data recorded by those sensors are of great value in many fields,such as users travel patterns analysis,decisionsupportforurbanplanners,andsoon.However,thelow-costGPSsensorswidelyu
5、sedonelectricbicyclescannotprovidehigh-precisionpositioning.Besides,themapmatchingfortheelectricbicyclestrackdataismorecomplexandchallengingdueto:(1)manystaypointson electric bicycles trajectories;(2)higher sampling frequency and shorter distance between adjacent track points on electric bicyclestra
6、ckdata;(3)someroadsonlyopenforelectricbicycles,andtheaccuracyofmatchingissensitivetothequalityoftheroadnetwork.Tosolve those issues mentioned above,an adaptive and accurate road network map matching algorithm is proposed named KFTS-AMM,whichconsistsoftwomaincomponents:thesegmentedKalmanfilteringbase
7、dtrajectorysimplification(KFTS)algorithmandsegmentedhidden Markov model based adaptive map matching(AMM)algorithm.Since Kalman filtering algorithm can be used for optimal stateestimation,thetrajectorysimplificationalgorithmKFTScanmakethetrajectorycurvesmootherandreducetheimpactofabnormalpoints*基金项目:
8、工信部工业互联网创新发展工程(TC200802C,TC200802G);浙江省自然科学基金(LQ20F020015)收稿时间:2021-01-07;修改时间:2021-08-04,2021-10-08;采用时间:2021-11-17;jos 在线出版时间:2023-01-13CNKI 网络首发时间:2023-01-19软件学报ISSN1000-9825,CODENRUXUEWE-mail:Journal of Software,2023,34(8):37933820doi:10.13328/ki.jos.006542http:/中国科学院软件研究所版权所有.Tel:+86-10-6256256
9、3on the accuracy of map matching by fixing the trajectory points automatically in the process of trajectory simplification.Besides,thematching algorithm AMM is used to reduce the impact of invalid trajectory segments on the map matching accuracy.Moreover,staypoints identification and merging step ar
10、e added into the processing of track data,and the accuracy is further improved.Extensiveexperimentsconductedonthereal-worldtrackdatasetofelectricbicyclesinZhengzhoucityshowthattheproposedapproachKFTS-AMMoutperformsbaselinesintermsofaccuracyandcanspeedupthematchingprocessbyusingthesimplifiedtrackdata
11、significantly.Key words:mapmatching;trajectorysimplification;Kalmanfiltering;trackdataanalysis;hiddenMarkovmodel(HMM);staypoints近年来,我国已经成为全球电动自行车生产和销售第一大国,同时,电动自行车也已经成为人们出行的主要交通工具之一.据统计,2018 年我国电动自行车的保有量已经达到了 2.5 亿1,随着 GPS 定位技术的不断成熟,越来越多的电动自行车被安装了 GPS 设备,由此获取到的海量轨迹数据为分析城市交通状况和用户出行规律提供了很好的基础2,3.地图匹配算
12、法的任务是将 GPS 记录的轨迹匹配到交通工具实际经过的道路上,这是对轨迹数据进行深度分析和有效利用的必要步骤.但是,电动自行车上普遍使用的成本低廉的 GPS 传感器无法提供高精度的定位,因此往往无法从原始的轨迹数据中直接得知实际经过的准确路线.目前,学者对于地图匹配的研究已经有 20 多年的历史,专注于解决地图匹配问题的文献也有上百篇之多4.然而,现有的各类算法大多是研究机动车轨迹数据的匹配问题.对于电动自行车轨迹的地图匹配算法的相关研究还比较少.相比于机动车的轨迹数据,电动自行车轨迹数据具有以下 3 个特点.特点 1:电动自行车轨迹上存在大量停留点.特点 2:电动自行车轨迹采样频率高,行驶
13、速度较慢,导致采样点距离较小,轨迹点密度相应增大.特点 3:电动自行车行驶路段更多,由于路网精度的限制,部分轨迹可能无法匹配到对应的路网上.p2p3p2p3p2 p3具体而言,特点 1 会导致地图匹配准确率的下降.停留点指轨迹上一组连续且相距较近的轨迹点,其产生原因分为两类:(1)由于停止或运动速度极慢;(2)由于车辆反复行驶过某区域3.这两类原因均会导致文献 4 中提到的不必要迂回的出现,从而降低匹配的准确率.例如,在图 1 中,当车辆在轨迹点与处行驶速度极慢,为两个停留点,由于 GPS 的测量误差5,与在道路 A 上的投影点前后顺序与道路 A 的方向相反,导致地图匹配算法计算出的路线为道路
14、 A道路 B道路 C道路 D道路 A,与事实情况不符.p1p2p3p4道路 D道路 A道路 B道路 C道路段匹配路线轨迹点轨迹点到道路段的投影图1因停留点导致的轨迹上不必要的迂回文献 6 对 GeoLife7,8轨迹数据集中不同出行方式的轨迹进行了分析,认为自行车与步行出行方式的轨迹数据有更高的方向变化概率与停止概率.在真实场景中,机动车只有当等待红绿灯或处于交通拥堵路段时才会导致轨迹上出现停留点,但是电动自行车用户拥有更大的行驶自由,例如可以随意在路边停车、在某较小区域内反复行驶,从而产生更多的停留点.因此对电动自行车轨迹上的停留点进行预先识别与处理十分必要.特点 2 会显著地降低地图匹配算
15、法的效率.电动自行车车速较慢,因此轨迹点更加密集,高峰时段下轨迹点密度会进一步提高.文献 9 将采样时间间隔在 1s 至 10s 之间的采样方式定义为高频采样,而时间间隔高于 2min的采样方式定义为低频采样.然而,这种定义方式只考虑了时间间隔,忽略了采样点在空间上的距离.当交通工具速度不同时,即使采样频率相同,也可能导致采样点空间距离相差很大.图 2(a)显示了一段郑州电动自行车轨迹,相邻轨迹点平均间距约为 60m、采样时间间隔约为 12s,图 2(b)显示了一段 CRAWDAD 数据集中旧金山出租车的轨迹10,相邻轨迹点平均间距约为 600m、采样时间间隔约为 30s.尽管电动自行车的采样
16、频率约为机动车的3 倍,但是轨迹点密度却达到了机动车的 10 倍.在许多开源轨迹数据集中,机动车轨迹上的轨迹点密度相对较低.3794软件学报2023 年第 34 卷第 8 期例如,开源数据集 T-Drive11,12采集了北京市的一万余辆出租车一周内的轨迹数据,平均采样时间间隔 177s,轨迹点间隔 623m,文献 13 中使用了 20102011 年间采集的北京市 6 万余辆出租车轨迹数据,平均采样时间间隔 70s,轨迹点间隔 560m.(a)电动自行车轨迹,轨迹点间平均距离约为 60 m(b)出租车轨迹,轨迹点间的平均距离约为 600 m图2电动自行车与汽车轨迹点间距示例,地图来源于谷歌地
17、图(https:/ DP 算法15的轨迹简化方法应用最为广泛,其基于下述假设:轨迹点的位置记录是交通工具在该时刻位置的真实记录.由于 GPS 测量存在误差,当交通工具位于高层建筑旁、桥梁旁时,误差会急剧增大5.基于 DP 的轨迹简化算法会计算出与原始轨迹形状差异最小的简化轨迹,因此倾向于保留 GPS 误差较大的轨迹点4,进而可能导致匹配准确率下降.例如,图 3 中高层建筑旁的轨迹点 GPS 误差很大,若使用简化后的轨迹进行地图匹配,将会得到错误匹配结果.由于卡尔曼滤波算法能够用于最优状态估计,因此使用卡尔曼滤波算法与轨迹简化算法相结合,能够在简化过程中不断修正轨迹点.同时,现有基于 DP 算法
18、15的轨迹简化算法1620依赖于人为设置的距离阈值,只有简化过程结束后才能计算出轨迹的简化比例.轨迹点停留点无效轨迹点异常点高层建筑图3电动自行车轨迹数据特点对于电动自行车轨迹数据的特点 3,我们使用无效轨迹片段来表示轨迹上不存在于给定路网的部分.当路网精度降低时,电动自行车的无效轨迹片段会相应增加.在实际的路网中,电动自行车能够在一些机动车不能驶入的路段行驶.例如,在图 3 中,星形轨迹点不存在于图中的路网上,这些轨迹点组成了一个无效轨迹片段.一些全局匹配算法使用折线间距离度量方法如弗雷歇距离来计算路网上的各条可能路线与待匹配轨迹的相似度21.当轨迹上存在无效轨迹片段时,这些算法仍会将相似度
19、最大的路线作为匹配结果.基于状态转移模型的地图匹配算法14,2225则会因无效轨迹片段的存在导致匹配过程中断4,无法对轨迹的有效部分计算出匹配路线.上述两类算法都会因无效轨迹片段的存在而使匹配准确率降低.为解决现有地图匹配算法因电动自行车轨迹数据的上述特点导致的匹配准确率下降、匹配效率不高的问题,本文提出了一种可自适应路网精度的电动自行车轨迹地图匹配方法 KFTS-AMM.该方法融合了基于卡尔曼滤波王东京等:电动自行车轨迹简化与自适应地图匹配算法3795算法的轨迹简化算法(KFTS),以及分段的隐马尔可夫模型(hiddenMarkovmodel,HMM)的地图匹配算法(AMM).本文的贡献主要
20、集中在以下 3 个方面.(1)提出了基于时空聚类的停留点处理算法,能够准确地识别与合并停留点,减少轨迹上的迂回,从而提高地图匹配算法的准确率.(2)提出了基于卡尔曼滤波算法的轨迹简化算法 KFTS,改进了 DPhull 算法,使其不依赖人为设置的距离阈值,仅使用轨迹简化比例作为简化过程参数.由于轨迹简化算法倾向于保留误差较大的轨迹点4,因此在轨迹简化过程中加入滤波操作对轨迹点加以修正,能够提升后续地图匹配过程的准确率.(3)使用分段的 HMM 的自适应地图匹配算法 AMM,能够在匹配的过程中不断检测出无效的轨迹片段,同时将有效的轨迹片段匹配到给定精度的路网图上,在不同精度的路网上均能取得良好的
21、准确率.本文第 1 节回顾了地图匹配算法、轨迹简化算法与轨迹停留点识别的相关研究工作.第 2 节介绍相关的定义以及问题描述.第 3 节详细介绍了本文提出的算法.第 4 节展示了在真实数据集上的对比实验结果.第 5 节总结了现有工作以及未来工作的重点.1 相关工作在本节中,我们回顾了地图匹配、轨迹简化以及轨迹停留点识别的相关研究工作.1.1 地图匹配文献 26 提出根据轨迹匹配过程中的采样点范围将地图匹配算法分为局部/增量算法2729与全局算法21,30.局部/增量算法使用轨迹的局部特征进行匹配,计算速度快,适用于高频率采样的轨迹,但当路网密集度较高时,准确率普遍较低.全局算法使用整条轨迹进行匹
22、配,为轨迹寻找一条相似度最高的路线,计算复杂度较高.Quddus 等人根据地图匹配算法所使用的技术将地图匹配算法分为以下 4 类26:基于几何关系的匹配算法31、基于拓扑关系的匹配算法32、基于概率统计的匹配算法33和其他匹配算法(例如:使用了诸如扩展卡尔曼滤波器34、模糊逻辑35、证据理论36和贝叶斯推理37等技术).但是,随着近年来又有许多新的方法被提出,这一分类标准已经不再适用.Chao 等人在文献 4 中提出根据核心匹配模型将地图匹配算法分为 4 个类别:相似度模型21,27、状态转移模型9,14,23,24,38、候选进化模型39和评分模型40.同时,Chao 等人还列举了 3 种给
23、地图匹配带来挑战的数据质量问题,包括不必要的迂回、异常点和路网中道路的密度,这 3 种问题均会降低地图匹配算法的准确率.在基于状态转移模型的地图匹配算法中,基于隐马尔可夫模型的地图匹配算法14,2225,38,41是最流行的,同时也被证实具有较高的准确率42.一些研究人员致力于提高地图匹配效率.地图匹配效率的提升可以通过以下 4 种方式14:使用空间索引技术43,44以加快对某个轨迹点的近邻点与近邻边的查找速度、避免路网图中最短路径的重复计算14,45、使用分布式与并行计算技术22,4648、压缩轨迹以减少参与计算的轨迹点.上述地图匹配算法设计的实验所使用的数据集多为机动车轨迹数据集,由于电动
24、自行车轨迹上存在大量停留点、采样频率高、轨迹点密集且存在大量无效轨迹片段的特点,已有算法不适宜直接应用在电动自行车轨迹数据上.1.2 轨迹简化轨迹简化算法是目前最主流的轨迹数据压缩处理方法49,将轨迹数据视为一条连续的折线,通过删除部分对折线形状影响较小的轨迹点,实现简化后折线与原始折线的近似拟合,从而完成轨迹数据的压缩.根据轨迹简化算法是否适用于实时计算,可以将现有轨迹简化算法划分为在线轨迹简化算法与离线轨迹简化算法2.O(n3)O(n2)O(nlogn)离线轨迹简化算法没有输入轨迹规模的限制,能够得到全局最优的简化结果.Bellman 算法50是最早用于解决轨迹简化问题的算法,利用了动态规
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 电动自行车 轨迹 简化 自适应 地图 匹配 算法
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。