基于PointPillars改进的点云目标检测算法.pdf
《基于PointPillars改进的点云目标检测算法.pdf》由会员分享,可在线阅读,更多相关《基于PointPillars改进的点云目标检测算法.pdf(5页珍藏版)》请在咨信网上搜索。
1、2023 年第 10 期计算机与数字工程收稿日期:2023年4月3日,修回日期:2023年5月9日作者简介:何俊杰,男,硕士研究生,研究方向:三维目标检测。任明武,男,教授,研究方向:模式识别与智能系统。1引言目标检测2作为一种重要的计算机视觉技术,能够高效地分类和定位场景中的目标。随着人工智能技术发展,基于深度学习的目标检测3方法层出不穷。与此同时,传感器4技术的不断突破促使业界对三维目标检测技术产生了需求。三维目标检测技术作为二维目标检测的拓展,更注重对环境中的空间结构信息进行处理,迅速成为学术界和工业界的研究热点,被广泛应用至自动驾驶5、机器人6等多个热门领域。根据点云目标检测7的方法流
2、程,可分为一阶段(one-stage)的方法和两阶段(two-stage)的方法。早期的点云目标检测方法以两阶段为主,主要包括PointRCNN8、PointRGCN9、STD10、VoteNet11等,这些方法能够充分地结合原始点云的空间信息,因此能够取得较高的精度,但计算成本较大,检测效率受限。随之出现了一阶段的点云目标检测方法,直接提取原始点云特征并回归目标检测结果。近年来,Vote3Deep12、VoxelNet13、SECOND14等一阶段方法被不断提出,仅需要单次推理即可得到点云目标检测的结果信息,取得了较高的检测速基于 PointPillars 改进的点云目标检测算法何俊杰任明武
3、(南京理工大学计算机科学与工程学院南京210094)摘要现有的点云目标检测方法虽然层出不穷,但主要以提升检测精度为主,检测效率较低,很难满足实际应用时的实时性需求。PointPillars1方法通过一种创新的点云特征处理方法,明显提升了点云目标检测的速度,为工业界的实际应用提供了可能性,但其精度相比速度略有欠缺。论文基于多尺度特征融合和3D注意力机制,对PointPillars方法的结构进行改进,提高了原方法对于多尺度目标的检测精度,弥补了该方法相比主流方法在检测精度上的不足。改进后的方法兼具较高的检测精度和较快的检测速度,具有一定的工程应用价值。关键词点云;目标检测;PointPillars
4、;多尺度;3D注意力中图分类号TP394.1DOI:10.3969/j.issn.1672-9722.2023.10.019Improved Point Cloud Object Detection Algorithm Based onPointPillarsHE JunjieREN Mingwu(School of Computer Science and Engineering,Nanjing University of Science&Technology,Nanjing210094)AbstractAlthough the existing point cloud object det
5、ection methods are constantly being proposed,these methods mainly focus on improving the detection accuracy,but their efficiency of detection is not high enough,it is difficult to meet the real-time requirements in practical applications.The PointPillars method significantly improves the speed of po
6、int cloud object detectionthrough an innovative point cloud feature processing method,which provides the possibility for practical applications in the industry.Combining the idea of multi-scale feature fusion and 3-D attention mechanism,this paper improves the structure of PointPillarsmethod to impr
7、ove the detection performance of the original method for multi-scale targets,which makes up for the lack of detectionaccuracy of this method compared with state-of-the-art methods.The improved method has better detection performance still withenough detection speed,and has certain value of engineeri
8、ng application.Key Wordspoint cloud,object detection,PointPillars,multi-scale,3-D attentionClass NumberTP394.1总第 408期2023 年第 10 期计算机与数字工程Computer&Digital EngineeringVol.51No.102313第 51 卷率。2019年,一种名为PointPillars1的一阶段点云目标检测方法被提出。该方法提出一种新型的点云特征处理方法,参数量更小,取得了比主流方法显著提高的检测速度,具有很高的工程应用价值。但PointPillars在特征提取
9、时主要关注点云的局部特征,因此在自动驾驶等领域的实际应用时,对车辆、非机动车和行人等多尺度目标的综合检测能力受限。本文首先简要介绍 PointPillars方法的整体架构,接着基于多尺度特征融合和3D注意力机制,对PointPillars的网络结构进行改进,并在 KITTI15数据集上进行相关测试。改进方法在维持高效率的前提下,对多尺度目标具有更高的检测精度。2基本理论2.1PointPillars整体网络结构PointPillars的主体网络架构如图1所示,主要由柱状特征提取网络(Pillar Feature Network)、二维特征提取网络和一个检测头(Detection Head)组成
10、。图1PointPillars主体网络架构图单帧待检测的原始点云输入网络后,通过柱状特征提取网络转换为点云数据的伪图像。在柱状特征提取网络中,原始点云数据首先被划分为若干均匀的柱状网格(Pillar),每个柱状网格使用一个九维的向量来表示网格中所有点云的信息。借助柱状划分,整个原始点云就可以使用一个张量进行表示,之后,再借助简化版的PointNet的思想,通过特征提取和最大池化层对张量进行降维,并转换为类似二维图像的点云伪图像。接下来使用二维特征提取网络进一步进行伪图像的特征提取,最后使用一个类似SSD的检测头部分来对伪图像特征进行三维包围盒的回归。2.2二维卷积部分输入 PointPilla
11、rs的原始点云经过柱状特征提取网络转换为一个伪图像后,PointPillars使用一个二维的卷积神经网络对其进行处理。该二维卷积部分的具体结构如图2所示。图2PointPillars二维卷积神经网络结构图从图中可以看出,该卷积神经网络主要由两个子网络结构组成:第一个子网络对输入的伪图像进行两次下采样操作,不断减小特征图的分辨率,同时提升其特征维度,最终可以得到三个分辨率和特征通道数都不同的特征图;第二个子网络对这些特征图的特征进行融合拼接,首先将这三个特征图进行上采样,把它们的分辨率恢复至相同的大小,接下来对这三个相同尺寸的特征图进行特征融合。具体的融合操作通过一个拼接(concatenati
12、on)来完成,在维持特征图尺寸的前提下,对三个特征图的特征通道进行拼接。如此以来,三个尺度的特征图的语义信息能够较好地融合在一起,以提高整个检测方法对多类别目标的检测性能。3改进的PointPillars方法本文提出的方法主要对 PointPillars的二维卷积模块进行改进:首先结合多尺度特征融合的思想,改进原始的一阶段检测流程和相关网络结构,提高其对多尺度信息的提取和检测能力;其次,结合simAM16的3D注意力机制来增强不同尺度下的特征信息。3.1基于多尺度特征融合的二维卷积神经网络PointPillars将原始点云转换为二维的伪图像后,进行后续的二维特征提取,并对提取后的结果回归目标检
13、测的位置和类别结果。该流程基于RPN的思想构建二维特征提取网络和后续的检测何俊杰等:基于PointPillars改进的点云目标检测算法23142023 年第 10 期计算机与数字工程头,通过one-stage的形式直接回归结果,虽然兼具高效性和一定的检测精度,但还具有一些问题。首先,原图像仅通过两次下采样得到低分辨率的特征图,该特征图的语义信息不足;其次,该结构没有充分利用低层特征图的空间信息,直接影响了对小尺度目标的检测效果;另外,在上采样还原后,原结构直接进行了通道拼接操作,没有很好地结合高分辨率特征的空间信息和低分辨率特征的语义信息。因此,本文基于多尺度特征融合的思想,对原有的二维卷积网
14、络结构进行改进,改进后的结构如图3所示。其中,本节对于原有的二维卷积模块进行结构化的改进。首先对原始的特征图进行自底向上的逐级下采样,下采样倍数逐级均匀增加。相比原网络结构,该部分增加了下采样的深度,以更好地结合更小尺度的特征信息。接下来,通过自顶向下的方式进行上采样,具体的上采样通过最近邻插值来进行,在减少计算成本的前提下尽可能保留原特征图的语义信息。特征图在自顶向下进行上采样的同时,与下采样流程中的上一级特征图进行特征融合,得到同时包含语义信息和特征信息的特征图。最后,本结构对融合后的不同尺度特征分别进行卷积核为33的卷积操作,减少上采样插值的重叠带来的影响。如此一来,改进方法对多尺度目标
15、能够具有更强的综合检测能力。图3基于多尺度特征融合和3D注意力改进的卷积神经网络结构图3.2基于SimAM的3D注意力机制对原始检测结构进行上述改进后,网络模型对多尺度目标的综合检测能力得到了提升。对于不同尺度的特征,每个特征经过不同层次的融合后都具有较高的通道数。基于此,本文受到SimAM的启发,基于一种无额外参数的3D注意力模块来提升对每个尺度特征的利用效率。其中,SimAM 的 3D 注意力权重如图 4 所示。相比现有的通道注意力与空间注意力来说,SimAM关注整个特征的3D注意力。为更好地实现注意力机制,该模块评估每个神经元的重要性。在所有神经元中,激活神经元通常会抑制周围神经元,即空
16、间抑制作用。具有空间抑制作用的神经元需要赋予更高的权重。图4SimAM的3D注意力权重示意图基于此,该模块使用如式(1)的能量函数来训练神经元之间的线性可分性。对于每个尺寸为CHW的多通道特征,其中的每个通道都有M=HW个能量函数。经过推导,每个能量函数的最小值可以通过式(2)得到。能量越低,神经元的重要性越高,因此其重要性可以通过1e*t来衡量。et()wtbtyxi=1M1i=1M1()1()wtxi+bt2+()1()wtt+bt2+w2t(1)e*t=4()2+(tu)2+22+2(2)基于上述原理,simAM模块通过3D注意力机制对多尺度的特征进行增强,如式(3)所示。其中,X为原特
17、征,E表示了X特征中所有通道和空间维度的最小能量,sigmoid函数用于约束可能过大的E值。对X特征中所有具有空间抑制作用的神经元赋予更高的权重,得到增强后的特征X。X=sigmoid1EX(3)如图5所示,在上一节改进卷积网络结构后,本节通过SimAM模块的优化能量函数推导每个特征的3D注意力权重,并提升模型对多个维度特征的鉴别能力,最终提升对不同尺度目标的检测效果。总而言之,simAM模块促使网络的后续结构更好地学习当前特征图的三维注意力信息,并增强重要的特征,抑制不重要的特征,最终提升模型对多尺度特征的检测精度。2315第 51 卷4实验与分析为了验证本文方法的实际检测性能,本文基于KI
18、TTI数据集来对提出的改进方法进行检验,并与改进前的原方法进行结果对比。实验使用 Pytorch1.3.0 框架,并使用 TitanV 显卡进行模型的训练和测试工作。本文使用PointPillars以及提出的改进方法基于KITTI数据集进行实验。其中,改进方法的模型训练时的超参数与原方法一致,以进行公平对比。使用的评价指标17为对应类别的平均精度(Average Precision,AP),该值越高,检测方法对当前类别的检测精度越高,相关计算公式如式(4)、式(5)、式(6)所示:p=NTPNAlldetections(4)r=NTPNAllgroundtruths(5)AP=01P()R d
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 PointPillars 改进 目标 检测 算法
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。