动态环境下视觉定位与建图的运动分割研究进展.pdf
《动态环境下视觉定位与建图的运动分割研究进展.pdf》由会员分享,可在线阅读,更多相关《动态环境下视觉定位与建图的运动分割研究进展.pdf(9页珍藏版)》请在咨信网上搜索。
1、2023 08 10计算机应用,Journal of Computer Applications2023,43(8):2537-2545ISSN 10019081CODEN JYIIDUhttp:/动态环境下视觉定位与建图的运动分割研究进展朱东莹1,钟勇2,杨观赐1,3,4*,李杨3(1.贵州大学 机械工程学院,贵阳 550025;2.中国科学院 成都计算机应用研究所,成都 610213;3.现代制造技术教育部重点实验室(贵州大学),贵阳 550025;4.省部共建公共大数据国家重点实验室(贵州大学),贵阳 550025)(通信作者电子邮箱guanci_)摘要:动态环境中视觉定位与建图系统受环
2、境中动态物体的影响,定位与建图误差增加同时鲁棒性下降。而对输入图像的运动分割可显著提高动态环境下视觉定位与建图系统的性能。动态环境中的动态物体可分为运动物体与潜在运动物体。当前动态物体识别方法存在运动主体混乱、实时性差的问题。因此,综述了视觉定位与建图系统在动态环境下的运动分割策略。首先,从场景的预设条件出发,将运动分割策略分为基于图像主体静止假设方法、基于先验语义知识的方法和不引入假设的多传感融合方法;然后,对这三类方法进行总结,并分析各方法的准确性和实时性;最后,针对视觉定位与建图系统在动态环境下运动分割策略的准确性、实时性难以平衡的问题,讨论并展望了动态环境下运动分割方法的发展趋势。关键
3、词:视觉定位与建图;动态环境;运动分割;实时性;移动机器人中图分类号:TP249 文献标志码:AResearch progress on motion segmentation of visual localization and mapping in dynamic environmentZHU Dongying1,ZHONG Yong2,YANG Guanci1,3,4*,LI Yang3(1.School of Mechanical Engineering,Guizhou University,Guiyang Guizhou 550025,China;2.Chengdu Institut
4、e of Computer Application,Chinese Academy of Sciences,Chengdu Sichuan 610213,China;3.Key Laboratory of Advanced Manufacturing Technology of the Ministry of Education(Guizhou University),Guiyang Guizhou 550025,China;4.State Key Laboratory of Public Big Data(Guizhou University),Guiyang Guizhou 550025,
5、China)Abstract:Visual localization and mapping system is affected by dynamic objects in a dynamic environment,so that it has increase of localization and mapping errors and decrease of robustness.And motion segmentation of input images can significantly improve the performance of visual localization
6、 and mapping system in dynamic environment.Dynamic objects in dynamic environment can be divided into moving objects and potential moving objects.Current dynamic object recognition methods have problems of chaotic moving subjects and poor real-time performance.Therefore,motion segmentation strategie
7、s of visual localization and mapping system in dynamic environment were reviewed.Firstly,the strategies were divided into three types of methods according to preset conditions of the scene:methods based on static assumption of image subject,methods based on prior semantic knowledge and multi-sensor
8、fusion methods without assumption.Then,these three types of methods were summarized,and their accuracy and real-time performance were analyzed.Finally,aiming at the difficulty of balancing accuracy and real-time performance of motion segmentation strategy of visual localization and mapping system in
9、 dynamic environment,development trends of the motion segmentation methods in dynamic environment were discussed and prospected.Key words:visual localization and mapping;dynamic environment;motion segmentation;real-time performance;mobile robot0 引言 城市信息化和治理水平的提升体现在车辆的自动/辅助驾驶、人员的高效疏导1。交通建设作为城市建设的重要领域
10、,发展高度标志着城市的现代化程度2,这需要车辆、机器人和人员实时获取在开放环境下移动过程中的位置、方向、速度等信息1。对这些信息的获取与处理能力可以归纳为三种能力:定位、建图和路径规划能力3,即对环境构建地图并确定自身在地图中的位姿,最后完成运动路径规划的能力。同时定位与地图构建(Simultaneous Localization And Mapping,SLAM)技术是同时完成定位与建图的技术。视觉SLAM系统是以相机为主要传感器的SLAM系统,视觉SLAM凭借着相机文章编号:1001-9081(2023)08-2537-09DOI:10.11772/j.issn.1001-9081.202
11、2070972收稿日期:20220706;修回日期:20220919;录用日期:20220919。基金项目:国家自然科学基金资助项目(62163007);贵州省科技计划项目(黔科合平台人才 2020 6007,黔科合支撑 2021 一般439)。作者简介:朱东莹(1996),男,浙江杭州人,硕士研究生,CCF会员,主要研究方向:自主智能系统;钟勇(1966),男,四川岳池人,研究员,博士,主要研究方向:大数据及其智能处理、云计算、软件工程;杨观赐(1983),男,湖南嘉禾人,教授,博士,CCF高级会员,主要研究方向:自主智能系统;李杨(1993),男,河南安阳人,博士研究生,主要研究方向:自主
12、智能系统。第 43 卷计算机应用成本低、安装方便、能获取丰富的环境信息等优点,成为机器人领域研究的热点4-5。目前,视觉SLAM系统多基于理想的静态环境,它的经典架构分为前端和后端6:前端负责获取图像中的特征,并依据多帧图像特征的几何约束来估计相机运动;为解决前端相机运动计算的误差累积问题,SLAM系统的后端优化和回环检测与前端同时运行,优化相机位姿。为解决跟踪丢失问题,视觉SLAM系统中的多地图策略逐渐成为主流7。与稳定的测试场景不同,真实环境存在动态干扰8,即环境中会不时出现动态物体,如室内环境中出现的人、宠物、机器人,室外道路行驶的车辆等。场景中的动态物体可以分为刚体与非刚体,也可以分为
13、运动物体与潜在的运动物体。环境中的动态物体会导致SLAM系统的定位与建图产生严重误差9,因此研究者们在提高动态环境下视觉SLAM的适用性上大多采取相似的策略,即在视觉SLAM系统前识别运动中的目标,分割并滤除运动物体后再进行定位与地图构建。目前,针对动态环境下SLAM系统的运动分割综述较少,其中多关注准确性与鲁棒性,很少涉及效率分析。随着近年来深度语义模型在运动目标识别与分割中表现出的卓越性能,提高动态环境下SLAM系统准确性的同时极大地增加了系统的计算压力。这使得运动分割效率与准确性的平衡越来越成为动态环境下视觉SLAM系统的关键。本文关注于动态环境下SLAM系统运动分割策略准确性与效率的平
14、衡,并重点针对基于语义信息的运动分割方法准确性与效率的改进策略进行总结。1 动态环境下的运动分割难点与挑战 动态环境(如图110)下存在运动物体(人、运动的汽车、动物)与潜在运动物体(静止的汽车、桌椅),这使视觉SLAM前端与后端面临不同的挑战。由于SLAM系统估计相机位姿时依赖图像中的特征,运动物体的特征会给相机运动估计带来较大里程误差。潜在运动物体虽然当前为静止状态,但在不同时间存在位姿变化,SLAM系统闭环检测时面对动态物体的位姿变化难以检测到闭环以减小累计误差10。而为了满足在算力与功耗受限的移动平台上 SLAM 系统的实时性需求,运动分割应具备高效率的特点,所以准确且高效率的运动特征
15、识别与分割是动态环境下视觉SLAM系统保证实时性与准确性的关键11。其中难点与挑战可以总结为以下3点:1)分割静态环境与运动物体。由于动态环境中的相机与动态物体同时运动,因此难以准确区分图像中的特征变换源于相机自身运动还是环境中物体的运动12。2)分割并去除潜在运动物体。因为潜在运动物体虽然当前为静止状态,但SLAM系统回环检测与多地图拼接时可能面对这些物体的位姿变化问题8,所以运动分割需要准确识别环境中的潜在运动物体,并在建图的过程中滤除或标记这些物体。3)运动分割的实时性。受限于机器人平台搭载的计算能力与功耗,同时SLAM系统存在对环境感知的实时性需求13,运动分割的实时性也成为分割方法的
16、重要性能指标。2 动态视觉SLAM的运动分割研究现状 2.1动态环境下视觉SLAM系统数据集为了评估不同动态场景下SLAM系统的性能,根据系统的使用场景,常用的动态环境分为室内与室外场景(见表1)。TUM 数 据 集14为 室 内 场 景 下 的 RGB-D(Red Green Blue Depth)图像序列,其中 Dynamic Objects类别下的 9个图像序列是室内动态环境下SLAM系统运动分割常用的数据集,该数据集包含人员坐着与行走两种动态场景。Bonn数据集15同样针对室内动态场景,包括9种场景的24个图像序列,比TUM数据集包含的场景更丰富,不仅包含运动的人,还包括运动的物体。O
17、penLORIS-Scene数据集16是IROS(Intelligent RObots and Systems)2019 Lifelong SLAM Challenge 的官方数据集,针对办公室、走廊、家庭、咖啡厅、市场5个室内动态场景,比TUM和Bonn数据集更具挑战性,包含变化的光照、视角,以及人类生活导致的环境变化,该数据集包含RGB-D图像、双目图像、2D 与 3D 激光点云、IMU(Inertial Measurement Unit)与轮式里程计数据。ADVIO数据集17是室内与室外场景下的视觉惯性数据集,场景包括楼梯、手扶电梯、升降电梯、办公环境与地铁站,主要动态物体是行人。KIT
18、TI数据集18针对室外道路环境,包含双目相机、激光雷达、IMU等多种传感器,图像中包含常出现于室外道路的动态物体,如汽车、自行车、行人等。Oxford数据集19对牛津部分道路进行上百次的数据采集,采集车行驶超过1 000 km,收集超过2 000万张图像,该数据集包含天气变化、行人与交通场景变化、道路与建筑施工场景,同样包含单、双目图像,激光点云和全球定位系统(Global Positioning System,GPS)/惯性导航系统(Inertial Navigation System,INS)数据。2.2动态环境下运动分割方法的分类与对比本文将现有运动分割策略以对环境的预设条件分为三类,即
19、基于图像主体静止假设的方法、基于先验语义信息的方法和基于多传感器信息补偿的方法(如图2所示)。图1动态环境下物体移动与光照变化Fig.1Object movement and illumination change in dynamic environment表1常用的动态环境下视觉SLAM数据集Tab.1Commonly used visual SLAM datasets in dynamic environment数据集TUM14Bonn15OpenLORIS16ADVIO17KITTI18Oxford19场景室内室内室内室内/室外室外道路室外道路采集方式手持/机器人手持机器人手持汽车汽车
20、数据类型RGB-D图像RGB-D图像RGB-D图像、双目图像、2D/3D激光点云、IMU、轮式里程计单目、IMU双目图像、激光点云、IMU单/双目图像、激光点云、GPS/INS动态物体人人、物品人、物品人、车、电梯行人、汽车行人、汽车2538第 8 期朱东莹等:动态环境下视觉定位与建图的运动分割研究进展图像主体静止假设方法虽然满足现实中的多数场景,但不适用于动态特征占图像主体的特殊场景,同时该方法不能去除潜在运动物体。结合语义信息的方法不预设动态特征占比,但语义提取能力依赖训练数据,且计算量大、效率较低。随着传感器技术的发展,激光雷达、IMU等传感器能在SLAM任务中发挥各自的优势,融合多传感
21、器的方法也体现更好的精度与鲁棒性20-22。多传感互补策略不对环境预设的同时不依赖语义信息,但引入多传感器的同时也引入了更多误差,多传感器数据融合也对系统的安装精度与融合算法提出了更高的要求,且该方法不能去除潜在运动物体。三类运动分割方法性能对比如表2所示。2.3基于图像主体静止假设的运动分割基于图像主体静止假设的运动分割方法以图像中大部分特征为静止特征的假设为基础,依据图像序列中特征点的几何约束区分静止与运动特征点。几何约束可以从极线、三角剖分、基础矩阵估计或重投影误差等式中得出23。本节将图像主体静止假设方法分为基于相机运动的几何约束分割方法、直接几何约束运动分割方法和基于构建静态背景的分
22、割方法,三类方法的优缺点如表3所示。这三类方法多基于ORB-SLAM(Oriented fast and Rotated Brief SLAM)与 DVO-SLAM(Dense Visual Odometry SLAM)系统,其中的经典方法如表4所示。2.3.1基于相机运动的几何约束分割方法基于相机运动估计的几何约束方法可以总结为先计算出相机运动后的位姿,再判断特征是否为动态特征。首先根据相邻两帧的几何约束计算出表示相机运动的本质矩阵E或单应矩阵H;然后根据相机位姿与图像特征点的运动变换一致性判断特征点是否为动态点。该方法在高动态环境中精度较差,并且由于不检测语义信息,难以识别潜在运动物体。如
23、图3(a)所示,相机以不同位姿C1、C2对空间中静止点P观测,p1、p2表示P在成像平面的投影点。对极约束为:xT2tRx1=0(1)其中:t表示相机从C1运动到C2平移向量t的反对称矩阵,R表示相机从C1运动到C2的旋转矩阵,t、R由图像中的主体静止特征计算得出;x1和x2分别为相机C1、C2到点P的向量。如图3(b)所示,相机在不同位姿C1、C2对运动点P观测时,运动点P从P1移动到P2处,式(1)中向量x1、x2、t不共面,故不满足式(1),以此识别动态特征点。该类方法在动态环境下的性能取决于相机运动估计的准确性,其中最常用的方法是通过随机抽样一致性(RANdom SAmple Cons
24、ensus,RANSAC)算法排除外点与动态点33。RANSAC算法可以从一组包含误匹配特征与少量运动特征的图像特征中,通过迭代方式估计出相机运动的变换矩阵,但这类方法对高动态场景鲁棒性较差。对于高动态场景,由于RANSAC算法较难计算出准确的相机运动矩阵,所以对运动特征的识别很难取得让人满意的效果。Alcantarilla等34首先利用RANSAC算法计算双目相机的粗略位姿,并基于双目图像计算场景流,将投影误差高于一定阈值的特征点视为运动点。高成强等24首先通过稀疏图像的最小光度误差匹配特征并对相机位姿初步估计,再依据图像图2动态特征筛除方法总结Fig.2Summary of dynamic
25、 feature screening methods表2三类运动分割方法的性能对比Tab.2Performance comparison of three types of motion segmentation methods方法类别基于图像主体静止假设的运动分割方法基于先验语义信息的运动分割方法基于多传感器信息补偿运动分割方法环境预设环境主体静止先验语义标注无传感器安装要求低低高分割精度低高中实时性中较差好识别潜在运动物体否是否表3基于图像主体静止假设的运动分割方法优缺点Tab.3Advantages and disadvantages of motion segmentation met
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 动态 环境 视觉 定位 运动 分割 研究进展
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。