点云投影结合轻量化卷积神经网络实现三维成像声呐快速目标分类.pdf
《点云投影结合轻量化卷积神经网络实现三维成像声呐快速目标分类.pdf》由会员分享,可在线阅读,更多相关《点云投影结合轻量化卷积神经网络实现三维成像声呐快速目标分类.pdf(11页珍藏版)》请在咨信网上搜索。
1、第 43 卷 第 1 期Vol.43,No.12024 年 1 月Journal of Applied AcousticsJanuary,2024 研究报告 点云投影结合轻量化卷积神经网络实现三维成像声呐快速目标分类任露露1,2,3尹 力1,2巩文静1,2,3李宝奇1,2黄海宁1,2(1 中国科学院声学研究所北京100190)(2 中国科学院先进水下信息技术重点实验室北京100190)(3 中国科学院大学北京100049)摘要:三维成像声呐的成像结果是三维点云,基于点云的三维成像声呐目标分类方法具有网络结构复杂、计算量大的特点。针对这一问题提出了一种将三维成像声呐成像结果从三维点云投影至二维图
2、像的方法,并且使用轻量化卷积神经网络实现了三维成像声呐快速目标分类。该方法首先对三维成像声呐波束形成后的波束域数据进行最大值滤波和阈值滤波,以降低点云数据维度;接着,依据三维成像声呐的波束方向,将点云投影为深度图和强度图,分别保存点云的位置信息和强度信息;然后,利用深度图和强度图分别作为第一个通道和第二个通道构建混合通道图,将混合通道图作为目标分类网络的输入,从而将三维点云的目标分类问题转换为二维图像的目标分类问题;最后使用MobileNetV2网络实现了三维成像声呐快速目标分类。实验结果表明,提出的投影方法可以用二维图像分类网络完成三维成像声呐点云的目标分类任务;而且训练过程中混合通道图比单
3、独的深度图和强度图收敛速度更快,结合目标分类网络可以实时进行目标分类,在真实数据集上分类正确率达到了91.13%。关键词:三维成像声呐;波束形成;声呐图像处理;目标分类中图法分类号:TB566文献标识码:A文章编号:1000-310X(2024)01-0047-11DOI:10.11684/j.issn.1000-310X.2024.01.006Point cloud projection combined with lightweight convolutional neural networkrealizes fast target classification of 3D imaging
4、 sonarREN Lulu1,2,3YIN Li1,2GONG Wenjing1,2,3LI Baoqi1,2HUANG Haining1,2(1 Institute of Acoustics,Chinese Academy of Sciences,Beijing 100190,China)(2 Key Laboratory of Science and Technology on Advanced Underwater Acoustic Signal Processing,Chinese Academy ofSciences,Beijing 100190,China)(3 Universi
5、ty of Chinese Academy of Sciences,Beijing 100049,China)Abstract:The imaging result of the three-dimensional(3D)imaging sonar is a point cloud,and the networkof point cloud target recognition is characterized by complex network structure and large computation.We propose a method to project the imagin
6、g result of three-dimensional imaging sonar from a pointcloud to an image,and use lightweight convolutional neural networks to achieve fast target classification forthree-dimensional imaging sonar.Firstly,the method performs maximum filtering and threshold filtering on the2022-08-10收稿;2023-05-16定稿中国
7、科学院国防科技重点实验室基金项目(CXJJ-20S035)作者简介:任露露(1996),男,山西晋城人,博士研究生,研究方向:声呐信号处理。通信作者 E-mail:482024 年 1 月beam domain data after the beamforming of the 3D imaging sonar beam to reduce the dimensionality of thepoint cloud.Next,based on the beam direction of the 3D imaging sonar,the point cloud is projected to a
8、depthimage and an intensity image to save the point cloud position information and intensity information respectively.Then,the mixed image is constructed using the depth image and the intensity image as the first channel and thesecond channel,and the mixed image is used as the input of the target cl
9、assification network,thus convertingthe target classification problem of 3D point clouds into the target classification problem of images.Finally,3Dimaging sonar fast target classification was implemented using MobileNetV2.The experimental results showthat the projection method proposed in this pape
10、r can be used to complete the target classification task ofthree-dimensional imaging sonar point cloud by an image classification network.Moreover,the convergence rateof the mixed channel image is significantly faster than that of the separate intensity image and depth image,and the target classific
11、ation can be conducted in real time with the combination of the target recognitionnetwork,achieving an accuracy of 91.13%on the real data set.Keywords:Three-dimensional imaging sonar;Beamforming;Sonar image processing;Object classification0 引言随着声呐技术的发展,基于声呐图像的目标探测和分类技术得到了广泛研究。在水下矿产资源勘探、管道和电缆探测、海洋生物分
12、类等领域具有重要作用12。目前常用的声呐设备类型有侧扫声呐、前视二维声呐、合成孔径声呐以及三维成像声呐等。侧扫声呐、前视二维声呐以及合成孔径声呐都属于二维成像声呐,其声呐图像是真实三维场景在二维斜距平面上的投影,相同距离不同高度的点在声呐图像中重合在一起,给后期的目标识别分类带来很大困难。三维成像声呐通过发射宽波束的声脉冲照射场景,使用二维接收面阵对回波信号进行采集,再经过波束形成获得三维空间中散射点的强度信息,可以实现对水下场景和目标的立体观测。三维成像声呐获取的目标信息相比二维声呐增加了高度维度的信息,因此三维成像声呐更加适合用于水下目标的分类识别。近年来,利用声呐图像实现水下目标分类识别
13、是国内外学者的研究重点。例如,Dura等3使用无监督马尔科夫分割算法分割出目标阴影并拟合为椭圆,提取椭圆参数作为形状特征,实现了对水下目标的分类;许文海等4利用水平集方法提取水下目标的轮廓,计算目标的不变矩特征,并将其作为后续目标分类的依据,取得了较好的效果。然而,上述方法基于人工设计并提取特征,对专业领域知识要求较高,且在特征提取过程中会不可避免地丢失部分关键信息,导致泛化能力不足。随着深度学习理论的不断发展,卷积神经网络(Convolutional neuralnetworks,CNN)在声呐图像目标分类领域得到了重要应用5。McKay等6使用预训练的CNNs结合支持向量机方法,与VGG1
14、6、VGG19等网络进行了比较,表明了其在合成孔径图像识别中的有效性;Alshalali等7采用迁移学习的方法,利用预训练的YOLO 模型,以45 frame/s实现水下蛙人的实时检测;巩文静等8通过对MobilNetV2网络进行改进,将三维成像声呐声学深度图像和同步采集的光学图像作为网络输入,实现了更好的分类性能。然而,由于水下光学成像作用距离有限,可能会限制该方法在实际应用中的具体表现,并且仅仅使用三维成像声呐成像结果的深度图这一点也具有改进的空间。与前视二维声呐、侧扫声呐和合成孔径声呐不同,三维成像声呐的成像结果是三维点云,包括场景中散射点的位置信息和强度信息。由于三维点云具有高度稀疏性
15、和不规则性,增加了点云处理难度,传统的三维点云目标分类方法主要通过提取点云特征点的结构属性、强度属性、形状属性或者多种属性的组合进行对比实现点云的分类任务。基于深度学习的方法也在点云数据处理任务上取得大的成功,比如使用体素方法Voxelnet9和使用点云特征方法PointNet1011。但是总体来说,点云数据处理的计算量和复杂度远大于二维图像处理,其处理时间和功耗也会大于二维图像处理。基于以上讨论,本文采用二维图像的目标分类方法而不是直接对点云进行处理来实现三维成像声呐目标分类任务。首先,本文提出一种投影方法,根据三维成像声呐的波束方向,将三维成像声呐的成像结果三维点云投影为深度图和强度图,分
16、别保存三维点云的位置信息和强度信息。然后,利第43卷 第1期任露露等:点云投影结合轻量化卷积神经网络实现三维成像声呐快速目标分类49用深度图和强度图分别作为第一个通道和第二个通道构建混合通道图,将混合通道图作为目标分类网络的输入。最后,使用轻量化卷积神经网络MobilnetV2完成三维声呐图像中的水下目标分类。该方法的优点是既保留了三维点云中散射点的深度信息和强度信息,同时也避免了三维点云目标分类方法巨大的计算量和功耗。实验结果验证了该方法的有效性,可以满足水下实时目标检测的需求。1 三维成像声呐点云生成1.1三维成像声呐波束形成三维成像声呐一般由无指向性发射换能器、二维接收面阵以及数据处理模
17、块组成。发射换能器发射声脉冲照亮整个成像场景,二维接收面阵用来接收回波信号12,数据处理模块主要的任务是对回波数据进行波束形成,得到成像结果1315。按照文献16中提出的方位角和俯仰角如图1所示,二维接收面阵有M N 个阵元,其中沿着y方向分布N行阵元,沿着x方向分布M 列阵元。三维成像声呐需要对所有距离切片上回波数据进行波束形成,这样便可以获得每一个距离切片上散射点的强度分布。远场波束形成中每个距离切片上回波数据的波束形成方法是一样的,现在对单个距离切片上回波数据的波束形成方法进行说明。对于单个距离切片的某个散射点,其单位方向矢量u和其在yz平面上的投影之间的夹角为i,u和其在xz平面上的投
18、影之间的夹角为i。xyzvmnu图1方位角及俯仰角定义Fig.1 Azimuth and pitch angle definition散射点的单位方向矢量表达式:r=(sini,sini,(cosi)2(sini)2).(1)则该距离切片上所有散射点的回波信号可以表示为 e=Ai pi+n,(2)其中,Ai为信号幅度,n为噪声矩阵,pi表示与目标方向有关的信号相位矩阵。pi=pi1,1pi1,2 pi1,Npi2,1pi2,2 pi2,N.piM,1piM,2 piM,NMN,(3)pim,n=exp j2cd(m 1)sini+(n 1)sini,(4)其中,m=1,2,M,n=1,2,N。
19、远场回波信号的相位可以分成与俯仰和方位向相关的两个独立分量。方位向与俯仰向波束形成导向矢量可以表示为 s=s,1,s,2,s,MT s=s,1,s,2,s,NT,其中:s,m=1Mexp(j2f(m 1)dsinc),s,n=1Nexp(j2f(n 1)dsinc).(5)因此二维平面接收阵远场单个距离切片上回波数据的常规波束形成计算公式为Y(sin,sin)=(sH e)s=AiMNMm=1exp(j2c(m 1)d(sin sini)Nn=1exp(j2c(n 1)d(sin sini)=Aisinc(M(d)u,i)sinc(d)u,i)sinc(N(d)u,i)sinc(d)u,i).
20、(6)根据公式(6)便可以将原始回波数据中的每一个距离切片进行波束形成,得到每个距离切片上散射点的强度分布。三维成像声呐接收到的原始回波数据维度为M N Nr,M N 是平面接收阵元的数量,Nr为距离向的采样点数;将所有距离切片的回波数据经过常规波束形成之后波束域数据的维度是N N Nr,其中N和N是方位向和俯仰向的波束数目,波束形成之后的波束域数据表示成像空间中散射点的强度。对于波束域中索引为(,r)的点在笛卡尔坐标系下的位置表示为502024 年 1 月x=rsin,y=rsin,z=rcos2 sin2,(7)式(7)中:r=ct/2,t为回波到达时间。如图2所示,通过计算波束域数据中每
21、个散射点的空间位置便可以将波束域数据转换为原始点云P,其中原始点云P 中包含N N Nr个散射点的位置信息和强度信息。NNNr?图2波束形成示意图Fig.2 Schematic diagram of beamforming由于海洋环境的复杂性,三维成像声呐系统采集得到的回波信号不仅包括探测场景和目标的信息,还包括海洋背景噪声、混响、声呐自身系统噪声干扰等非目标信息。这些干扰在声呐图像上表现为噪点,需要对声呐图像进行预处理,实现抑制干扰、提升图像质量的目的。三维成像声呐成像结果的预处理包括最大值滤波和阈值滤波这两个步骤,可以去除大部分的干扰和噪声,而且操作简单,运算量小,可以实时运行。1.2最大
22、值滤波三维成像声呐的使用场景包括水下地形测绘、水中目标探测等,其中感兴趣目标在整个三维成像空间中表现为若干连续曲面和孤立散射点的集合。而三维成像声呐波束形成之后的波束域数据维度是NNNr,表示整个三维成像空间中的散射点的强度分布,其中大部分空间中并不存在目标,其强度为环境噪声,需要将其去除。由于三维成像声呐的工作频率为数百千赫兹且工作距离通常不大于100 m,其声波穿透射能力弱、声线弯曲效应小,同时其波长短,远小于感兴趣目标的尺度,在对感兴趣目标成像时不会发生绕射,同一个波束前方物体会对后方物体造成遮挡。所以对波束域数据按照波束方向进行最大值滤波,即每个波束方向仅仅保留强度最大的点,经过最大值
23、滤波之后的点云中包含了N N个散射点位置信息和强度信息。图3为方框、渔网、绳子这3种目标最大值滤波后点云。-10-10-5-50y/mx/mz/m001010101520555-10-10-5-50y/mx/mz/m001010101520555-10-10-5-50y/mx/mz/m001010101520555(a)?(b)?(c)?图3最大值滤波点云Fig.3 Maximum filtered point cloud1.3阈值滤波最大值滤波已经大大降低了数据量,去除了大部分噪声,但是从最大值滤波的输出结果中仍然存在很多噪声,很难分辨出目标。考虑到三维成像声呐通常用于水下小目标探测,感兴趣
24、目标通常不会充满整个观测视野,而且目标的后向散射强度要明显大于环境噪声。根据这一特性,使用阈值滤波将幅度较小的噪声点进行去除,阈值设定为最大强度的22%,即最大强度的第一旁瓣(13.26 dB)高度。如图4所示,经过阈值滤波之后便可以看出目标轮廓。为了方便后续将三维点云投影至二维图像,阈值滤波将强度小于设定阈值的散射点强度和距离第43卷 第1期任露露等:点云投影结合轻量化卷积神经网络实现三维成像声呐快速目标分类51都置零,这样阈值滤波之后点云中点的个数依旧是N N。2 三维点云至二维图像投影三维点云具有高度稀疏性和无序性,这两个特点使得三维点云难以处理以及处理运算量大。三维成像声呐生成的点云同
25、样是高度稀疏的和无序的,但是这些点云中的点分布具有一定的规律性,在距离向以及两个角度向都分布在预定义的网格上。利用这个特性,便可以将三维点云投影为二维图像,同时保留点云的强度信息和位置信息。图5为三维点云至二维图像投影流程图。2.1点云生成深度图经过阈值滤波和最大值滤波之后,三维成像声呐点云中包含了N N个散射点的位置信息和强度信息,N和N分别是水平方向和垂直方向的波束数量,其中位置信息为散射点在声呐坐标系下的三维坐标,用公式(8)表示。p,=x,y,z,.(8)将每个波束方向散射点的距离进行归一化处理并且映射至0 255区间范围,便可以实现深度图的生成,深度图中每个像素数值与其对应散射点的三
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 投影 结合 量化 卷积 神经网络 实现 三维 成像 声呐 快速 目标 分类
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。