基于深度学习的智能船舶轻量化水面障碍物视觉检测与测距方法.pdf
《基于深度学习的智能船舶轻量化水面障碍物视觉检测与测距方法.pdf》由会员分享,可在线阅读,更多相关《基于深度学习的智能船舶轻量化水面障碍物视觉检测与测距方法.pdf(11页珍藏版)》请在咨信网上搜索。
1、第6卷 第5期2023年10月无人系统技术Unmanned Systems TechnologyVol.6 No.5October 2023基于深度学习的智能船舶轻量化水面障碍物视觉检测与测距方法朱凡1,潘宝峰1,马勇2,3,4,6,祝贵兵1*,吴中岱5,6(1.浙江海洋大学船舶与海运学院,舟山316022;2.武汉理工大学水路交通控制全国重点实验室,武汉430063;3.武汉理工大学航运学院,武汉430063;4.武汉理工大学国家水运安全工程技术研究中心,武汉430063;5.中远海运科技股份有限公司,上海200135;6.中远海运集团院士工作站,上海200135)摘要:针对智能船舶的自主航
2、行障碍物视觉快速检测与测距需求,提出一种基于深度学习的智能船舶轻量化水面障碍物视觉检测与测距方法。从障碍物检测速度和计算量的角度出发,该方法可提升智能船舶环境感知能力。首先,针对障碍物检测问题,在Yolov4检测模型的框架下,构建基于MobileNet特征提取网络的DIS-Yolo水面障碍物检测模型,实现模型网络结构的轻量化改进。其次,针对障碍物测距问题,基于所构建的障碍物检测模型和COMS成像模型,提出水面障碍物测距机制,实现水面障碍物的高精度测距。最后,通过模拟实验验证所改进模型的有效性与测距函数的精确度。所提出的方法可提升智能船舶的航行安全性,同时可为智能船舶环境感知需求提供新的思路。关
3、键词:深度学习;智能船舶;单目视觉;Yolo;MobileNet;视觉检测;障碍物测距中图分类号:U664.82 文献标识码:A 文章编号:2096-5915(2023)05-017-11DOI:10.19942/j.issn.2096-5915.2023.05.45Deep Learning-based Lightweight Water Surface Obstacle Visual Detection and Distance Measurement Approach for Intelligent ShipsZHU Fan1,PAN Baofeng1,MA Yong2,3,4,6,ZH
4、U Guibing1*,Wu Zhongdai5,6(1.School of Naval Architecture and Maritime,Zhejiang Ocean University,Zhoushan 316022,China;2.National Key Laboratory of Waterway Traffic Control,Wuhan University of Technology,Wuhan 430063,China;3.School of Navigation,Wuhan University of Technology,Wuhan 430063,China;4.Na
5、tional Engineering and Technology Research Center of Water Transport Safety,Wuhan University of Technology,Wuhan 430063,China;5.Cosco Marine Technology Co.LTD,Shanghai 200135,China;6.Cosco Marine Technology Co Academician Workstation,Shanghai 200135,China.)Abstract:Aiming at the requirements of rapi
6、d visual detection and ranging of obstacles for autonomous 收稿日期:2023-05-23;修回日期:2023-08-11作者简介:朱凡,硕士研究生。通讯作者:祝贵兵,博士,副教授。引用格式:朱凡,潘宝峰,马勇,等.基于深度学习的智能船舶轻量化水面障碍物视觉检测与测距方法 J.无人系统技术,2023,6(5):17-27.Zhu F,Pan B F,Ma Y,et al.Deep Learning-based Lightweight Water Surface Obstacle Visual Detection and Distance
7、 Measurement Approach for Intelligent Ships J.Unmanned Systems Technology,2023,6(5):17-27.第 6 卷无人系统技术navigation of intelligent ships,a deep learning-based lightweight water surface obstacle visual detection and ranging method is proposed for intelligent ships.From the perspective of obstacle detecti
8、on speed and computational complexity,this method can enhance the environmental perception capabilities of intelligent ships.For the obstacle detection problem,the DIS-Yolo water surface obstacle detection model based on the MobileNet feature extraction network is constructed within the framework of
9、 the Yolov4 detection model,achieving a lightweight improvement of the model network structure.For the obstacle ranging problem,a water surface obstacle ranging mechanism is proposed based on the constructed obstacle detection model and COMS imaging model,realizing high-precision ranging of water su
10、rface obstacles.Finally,the effectiveness of the improved model and the accuracy of the ranging function are verified through simulated experiments.The proposed method can improve the navigation safety of intelligent ships and provide new ideas for the environmental perception needs of intelligent s
11、hips.Key words:Deep Learning;Smart Ship;Monocular Vision;Yolo;MobileNet;Visual Detection;Obstacle Ranging1 引 言 船舶在水上航行时,确保安全和高效是至关重要的。船舶遇到的障碍物如漂浮物、礁石、其他船只等,可能会对船舶的正常航行造成严重影响,甚至可能引发事故。因此,实时、准确地检测水面上的障碍物对于船舶航行至关重要1。传统的障碍物检测方法如声呐和雷达虽然取得了一定的效果,但在应对复杂环境和识别不同类型障碍物时仍然面临挑战2。近年,深度学习技术在机器视觉领域取得了显著的进展,为检测水面障碍物
12、提供了新的可能。深度学习凭借强大的特征自学习和应用泛化能力,在船舶环境感知领域已经得到大量的应用3,众多基于深度学习神经网络的目标检测模型也相继被提出。Lee等4通过Unity虚拟视景采集船舶图片制作数据集再对Yolov3进行训练,实现了海上船舶目标检测。Lin等5将通道注意力机制引入Faster R-CNN,通过抑制冗余特征并将水面目标的检测精度提升了4.5%。李国梁等6使用残差网络对红外和可见光图像进行特征提取,然后通过注意力机制对两个图像的特征进行加权融合得到融合图像,在目标检测和识别应用场景中,该算法的表现优异。Chen等7在检测模型中使用高分辨率的卷积特征图来提取特征并在多层卷积图中
13、提取不同的尺度以提升对小目标的检测能力,该方法的检测精度对比传统方法提高了约 7%。Wei等8对SAR舰船图像进行预处理,在Faster-RCNN中引入拓展卷积,对比原始模型,目标检测精度提升了约3.3%。钱坤等9在Yolov5的网络架构基础上将随机池化的多卷层引入原有的空间金字塔池化网络,从而将检测精度提升了3.2%。王文杰等10使用Ghost网络结构改善Yolov5主干网络卷积结构,并引入注意力机制加强特征感知,在检测精度上对比原始模型实现了2.7%的提升。然而,上述学者提出的深度学习目标检测模型均存在模型网络结构臃肿、复杂度高与计算量过大等问题。同时,上述模型依赖大量的样本数据驱动,使得
14、基于深度学习的船舶环境感知模型普遍需要依赖硬件系统强大的计算能力。而实用级的深度学习目标检测模型普遍部署在具有强大计算能力的本地计算机端。因此,如何将深度学习目标检测模型进行轻量化改进并高效地部署在资源受限的终端设备,从而在低功耗的环境下进行智能前移是目前目标检测技术应用中极具挑战性的难题。为解决上述问题,我们提出了一种融合几何推导和深度学习的轻量级水面障碍物识别与测距方法。主要贡献可以概括为以下几点:(1)本文对 Yolov4 与其他主流的单阶段和双阶段目标检测模型在水面障碍物检测任务中的性能进行了比较,并评估了CSPDarkNet11、ShuffleNet12、ResNet5013、Mob
15、ileNetV214、ResNet1815等五18第 5 期朱凡等:基于深度学习的智能船舶轻量化水面障碍物视觉检测与测距方法种识别分类模型在此类任务中的检测与测距性能;(2)在Yolov4的基础上提出了轻量化水面障碍物检测模型 DIS-Yolo;(3)基于摄像头 COMS 的成像原理与几何模型,求出水面坐标系与像平面坐标系的对应关系,提高测距方法的精度。为验证所提方法的有效性和可靠性,在模拟器中进行了实验并与现有方法进行了比较。实验结果表明,本方法在障碍物检测和距离测量方面具有较高的精度和稳定性,有助于提升智能船舶的环境感知能力。基于深度学习的智能船舶轻量化水面障碍物视觉检测与测距方法整体框架
16、如图1所示。2 相关工作 2.1Yolov4目标检测模型Yolo 是一种先进的单阶段目标检测框架16。Yolov4 为 Yolo 系 列 的 第 四 代。Yolov4 选 择CSPDarkNet53作为主干网络,传入图像经主干网络处理后输出三张尺度为 5252、2626、1313的特征图,每个不同尺度的特征图包含不同的语义信息。在特征金字塔结构中,Yolov4将特征提取网络使用了特征金字塔结构和路径聚合网络相结合的方式,进一步提升了模型的性能。特征金字塔结构通过使用不同大小的池化操作,将输入图像的不同尺度的特征信息提取出来,从而适应不同大小的目标。路径聚合网络通过上采样和下采样来连接底层特征和
17、高层特征,缩短了各层之间的路径并提升了网络特征的提取能力。预测网络是用来对目标进行分类和定位的部分。它通过将各层特征图进行卷积操作,将检测结果输出为边界框和类别概率分数。预测网络采用多尺度预测策略,可以检测不同大小的目标。Yolov4和Yolov5相比,两者在框架上基本一致17,不同之处在于Yolov5在主干网络输出部分增加了Focus与CSP结构,从而提升了目标检测的精度,但这也使得Yolov5网络结构更为复杂。为了提升Yolov4的检测精度,本文在Yolov4的框架下,用Focal Loss损失函数替换目标置信度损失函数,并用MobileNet网络结构和深度可分离卷积分别替代了原模型结构中
18、的CSPDarkNet53和卷积结构,从而实现水面障碍物目标检测模型的轻量化。2.2MobileNetV2网络与深度可分离卷积近年来有很多轻量化的卷积神经网络结构被研究出来,如MobileNet与ShuffleNet等。MobileNetV2网络为Google团队提出的MobileNet系列轻量化网络结构的第二代,其继承了MoblieNetV1网络的思想,使用深度可分离卷积作为构建模块,针对MobileNetV1网络易在训练的反向传播过程中出现梯度消失问题引入逆残差连接模块,并将激活函图1基于深度学习的智能船舶轻量化水面障碍物视觉检测与测距方法整体框架图Fig.1Overall framewo
19、rk diagram of deep learning-based lightweight water surface obstacle visual detection and distance measurement approach for intelligent ships19第 6 卷无人系统技术数由 Rule 更换为 Rule6,以减少特征信息丢失。MobileNet系列网络成功实现轻量化的主要原因是使用深度可分离卷积代替传统卷积,通过减少参数和网络计算的数量来实现网络结构的轻量化18。但随着网络结构检测的参数量的减少,网络结构检测精度将略微下降。因此,通过使用深度可分离卷积代替普
20、通卷积是权衡检测精度和计算能力后得到的最优解。图2与图3描述了标准卷积与深度可分离卷积的结构。与使用、输入数据深度相同的多个卷积核实现卷积求和的标准卷积相反,深度可分离卷积将标准卷积过程分解为两个步骤:逐通道卷积和逐点卷积。传入的图片首先进行逐通道卷积再进行逐点卷积,在逐通道卷积过程中,一个卷积核只负责一个通道,卷积核数与通道数相同。逐通道卷积过程生成的特征图再进行逐点卷积,逐点卷积与标准卷积较为相似,设M为输入端的通道数,其卷积核尺寸为11M,逐点卷积对逐通道卷积生成的特征图在深度方向上进行加权组合,输出最终的特征图。3 方 法 3.1Focal Loss损失函数为确保算法的实时性,单阶段深
21、度学习算法选择在整张图片上回归预测目标的坐标,相较于双阶段深度学习算法省去了生成目标候选框过程。水面障碍物多数存在目标较小、背景像素居多的特点,这造成大部分候选框位于背景区域使得正负样本不均衡。当正负样本分布不均衡时,损失函数会更偏重样本更多的类,即模型会朝向与所预期不同的方向进行优化。DIS-Yolo 通过借鉴Focal Loss损失函数改进二元交叉熵损失函数以减轻正负样本失衡的影响19。Yolov4算法总损失包括目标置信度损失、类别损失与边框回归损失三部分,其中目标置信度损失函数由二元交叉熵函数形式构成。Focal Loss在二元交叉熵的基础上引入平衡系数与调制系数,平衡系数代表正负样本的
22、权重参数,用于降低负样本对模型的影响;调制系数表示可调节因子,用于控制易分类样本和难分类样本的权重,越大表示目标置信度越高,样本越容易区分,反之亦然。式中,的值域为0到1,大于0。在本文模型训练中,经实验,与的值沿用文献 15 中的结果,当平衡系数取0.25,调制系数取2,效果最好。通过改进后的目标置信度损失函数为Loss(cf)=-obji=0s2j=0BIobjijCji(1-Cji)ln(Cji)+(1-Cji)ln(1-Cji)-nobji=0s2j=0BIobjijCjiln()Cji+(Cji)()1-()1-Cjiln()1-Cji(1)3.2DIS-Yolo模型网络介绍本文设计
23、了轻量级的水面障碍物检测模型DIS-Yolo,融合 MobileNetV2 和 Focal Loss 损失函数,实现网络轻量化的同时尽可能地保证检测精度。本文所改进的DIS-Yolo模型框架可分为主干网络MobileNetV2、加强特征提取网络Neck和头部网络 Yolo Head 三个部分。其中,Neck 主要包括SPP-Net(空间金字塔池化网络)与PANet(路径图2标准卷积结构图Fig.2Standard convolution structure diagram图3深度可分离卷积结构图Fig.3Depthwise separable convolution structure dia
24、gram20第 5 期朱凡等:基于深度学习的智能船舶轻量化水面障碍物视觉检测与测距方法聚 合 网 络)。为 减 少 网 络 结 构 参 数,使 用MobileNetV2 网 络 结 构 代 替 CSPDarkNet53 作 为Yolov4的主干网络,并用深度可分离卷积代替网络框架中的所有常规卷积。网络的特征输出采用3种尺寸的特征图,输入图像像素为4164163,输出5252、2626、1313尺寸的3种特征图。替换模型的优化器,将SGD替换为Adam。Adam相比SGD,增加了一阶动量和二阶动量,使得损失函数更接近全局最小值。借鉴Focal Loss函数思想,对原模型中的目标置信度损失函数进行
25、改进,以降低数据集样本不平衡问题的影响,引入平衡系数 与调制系数,用于降低负样本对模型的影响。通过上述方法改进后的DIS-Yolo模型网络结构如图4所示。3.3单目视觉与障碍物测距算法图像采集步骤是将真实世界的三维水平面坐标系投影到单目摄像头的COMS成像平面坐标系中,而测距步骤为图像采集步骤的倒序。因此对目标测距需先获得该目标在COMS成像平面的坐标参数,再结合单目摄像头的横向视角、纵向视角、俯仰角度和摄像头水平高度等参数,将COMS成像平面坐标转化为三维水平面坐标,并通过转换关系计算出目标与单目摄像头间的距离。其中,单目摄像头的横向视角与纵向视角角度为固定值,单目摄像头的俯仰角度和摆放高度
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 深度 学习 智能 船舶 量化 水面 障碍物 视觉 检测 测距 方法
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。