基于轻量化融合损失网络的单目深度估计.pdf
《基于轻量化融合损失网络的单目深度估计.pdf》由会员分享,可在线阅读,更多相关《基于轻量化融合损失网络的单目深度估计.pdf(6页珍藏版)》请在咨信网上搜索。
1、第 卷 第 期 智 能 计 算 机 与 应 用 年 月 文章编号:()中图分类号:文献标志码:基于轻量化融合损失网络的单目深度估计周润民,王晓红,王 辉,苏 靖,刘 璐(贵州大学 矿业学院,贵阳;贵州大学 林学院,贵阳)摘 要:针对现有监督学习的单目深度估计存在编码器模型参数量大、计算复杂度高等问题,本文构建了一种基于轻量化融合损失网络的单目深度估计模型,该模型基于编码器解码器设计。首先,编码器采用网络搜索技术的;其次,解码器设计一种结合双通道空间注意力机制的 结构模型;最后,在解码器的输出端基于该模型构建 损失网络,对物体边缘、纹理和轮廓差异进行惩罚,来弥补编码解码阶段特征信息表达能力不足的
2、问题。在 数据集上开展了试验,试验结果表明:该模型深度估计的均方根误差()达到了,优于原始基准模型。关键词:单目深度估计;轻量化;损失网络;空间注意力机制 ,(,;,)【】,(),【】;?哈尔滨工业大学主办专题设计与应用基金项目:国家自然科学基金();教育部规划基金项目();贵州省科技计划项目(黔科合支撑一般)。作者简介:周润民(),男,硕士研究生,主要研究方向:深度学习、三维测图与重建;王晓红(),男,博士,副教授,主要研究方向:遥感数据处理与分析、技术应用。通讯作者:王晓红 :收稿日期:引 言场景深度感知是重建周围环境的关键环节,包含了目标的三维结构信息,对于室内三维测图、无人机避障和自动
3、驾驶等研究领域都具有重要的意义。目前深度信息的获取可以分为主动式和被动式。主动式获取方式有激光雷达、相机和 结构光等,均是通过反射物体表面来获取深度信息,但通常设备价格昂贵、体积重及功耗高;被动式获取是基于图像序列,利用相机捕获同一场景下单摄或者多摄目标的影像,通过三角测量方式获取深度信息,拍摄时要求时间同步,通常拍摄设备体积较大,不适用于微型机器人平台(例如微型航空和地面自动驾驶),因此研究成本低、体积小和能源效率高的单目相机进行场景深度感知具有重要的现实意义。当前采用的编码端模型臃肿、参数量大,如何得到轻量化且精准的图像深度估计模型成为了关键性挑战。相关工作传统单目深度估计依靠手工提取特征
4、,输出的深度图像比较模糊,而且场景中物体细节部分信息丢失,导致估计的图像深度信息不理想。随着深度学习的发展,极大的促进了深度估计领域的发展。对于高精度的深度估计任务,文献提出将卷积神经网络(,)用于预测单目图像深度估计,设计了一个由粗到细的两个堆栈组成的卷积神经网络,粗尺度网络预测图像的全局深度,细尺度网络提取局部深度并优化图像的 局 部 细 节;文 献 将 连 续 条 件 随 机 场(,)和深度卷积神经网络相结合,构建深度卷积神经场模型来提升深度估计效果;文献同样采用双尺度网络模型进行深度估计,同时引入了感知损失使预测深度进一步提高;文献构建了一种基于残差学习的全卷积网络架构用于预测图像的深
5、度估计,该模型编码器采用 模型结构,该结构层次更深同时能够提取更加丰富的特征信息,但是更深的网络导致模型臃肿、参数量增加、计算复杂度高;文献构建了一种轻量金字塔解码结构的单目深度估计模型,编码器使用 用于特征提取,解码器将轻量金字塔解码模块提取到的不同感受野特征图进行融合,并采用跳跃连接实现知识共享,以提升深度估计的性能。近年来深度学习不断发展,网络模型结构的轻量化、高效越来越重要。文献通过深度可分离卷积代替标准卷积,提出了一种轻量化的网络模型,网络的运行速度有很大的提升,但该网络模型结构简单,没有复用图像特征进行特征融合,随后提出了更加高效的网络模型;文献构建了一种以 为基础,适合在嵌入式系
6、统上使用的模型,该模型的推理速度得到了进一步提升,但是由于解码器采用的是传统 结构上采样,导致预测深度图目标轮廓模糊、边缘细节不够锐利;文献提出了一种可以进行量化的单目深度估计模型,并完成对该模型的量化压缩工作,该模型实现了网络模型的轻量化,但是以牺牲深度估计的准确性为代价的。本文构建一种基于轻量化融合损失网络的模型结构,对预测结果在多个网络上进行特征约束。模型在编码阶段提取全局特征,解码阶段通过特征融合整合全局和局部特征信息,使得预测的深度图具有很好的深度连续性,最后预测的深度图通过损失网络更好地惩罚预测信息和目标信息,进一步提高深度估计精度。整体模型框架基于轻量化融合损失网络的模型结构如图
7、 所示。在整体模型框架中,编码器阶段是图像特征的提取阶段,低维特征分辨率较高,包含丰富的特征信息,而高维特征分辨率较低,提取到的图像特征更加抽象;解码器阶段是提取特征的恢复阶段,将编码器提取的高维特征与跨层共享的低维特征进行特征融合,生成清晰准确的特征预测图;最后,预测深度传递到 损失网络进行融合感知。L o s s N e tC o n v-R e L U-C o n vE n c o d e rR e s N e t 5 0L S+w L PI n p u t R G BG r o u n d t r u t hL o c a l F e a t u r eL o c a l F e a
8、t u r eL o c a l F e a t u r eG l o b a l F e a t u r e1/3 21/1 61/81/4P r e d i c t e d1?1 C o n v1?1 C o n v1?1 C o n vS F FS F FS F Fu p s a m p l es i g m o i d图 基于轻量化融合损失网络的模型结构 智 能 计 算 机 与 应 用 第 卷 编码器结构在样本数据较少的情况下,为获得更高的准确率,通常会扩展深度学习模型的深度、宽度以及分辨率。常规卷积神经网络尽管可以任意调整其中的几个维度,但是都需要手动调节参数,且很可能伴随着模型性能
9、和效率的下降。是一种结合神经网 络 搜 索 技 术 的 多 维 度 混 合 放 缩 模 型,在 的基线上调整深度、宽度以及分辨率缩放获得。式():,()其中,、为常数,是模型深度、宽度和分辨率的网络搜索技术参数,缩放系数 是模型的扩张量。目前深度估计任务编码器大部分采用 作为特征提取器,通过不断加深网络的深度以获取更高的精度。但随着网络的加深,模型变得十分庞大,计算效率低。因此,从实际应用的角度,综合考虑参数尺寸及模型复杂度,本文选择 模型并运用迁移学习加载预训练模型,提高深度预测性能的同时加速网络收敛,防止梯度弥散和梯度爆炸等问题。解码器结构解码器通过编码器输出的特征图进行上采样,并在空间维
10、度上恢复特征映射,生成与输入尺寸相同的深度图。传统的解码器采用卷积与插值的 结构恢复深度图,本文使用一种全新的解码器结构 (),主要包含选择特征融合模块(,),相邻 模块之间通过跳跃连接和双线性插值上采样恢复到对应尺度,其中 卷积层使输入值的通道维度减少,与编码器对应的跳跃连接输出值在通道维度上相等,然后经过两个卷积层和一个 函数得到预测深度图。3?3 C o n vB NR e L U3?3 C o n vB NR e L U3?3 C o n vS i g m o i dG l o b a lF e a t u r eL o c a lF e a t u r e图 选择特征融合模块 模块类
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 量化 融合 损失 网络 深度 估计
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。