ToF深度相机技术白皮书.pdf
《ToF深度相机技术白皮书.pdf》由会员分享,可在线阅读,更多相关《ToF深度相机技术白皮书.pdf(22页珍藏版)》请在咨信网上搜索。
1、1 ToF深度相机技术白皮书修订于 2020 年 3 月 31 日 3 目录 1 3D视觉介绍.4 2 3D视觉方案介绍.5 2.1 双目技术.5 2.2 结构光技术.6 2.3 双目、结构光及 ToF 技术比较.7 3 ToF基本原理.8 3.1 i-ToF 原理.8 3.1.1 连续波调制(CW-iToF).8 3.1.2 脉冲调制(PL-iToF).9 3.1.3 CW-iToF 与 PL-iToF 对比.10 3.2 d-ToF 原理.10 4 ToF技术挑战.12 4.1 i-ToF 挑战.12 4.1.1 飞点噪声(Flying pixels).12 4.1.2 多径干扰(Mult
2、i-Path Interference,MPI).13 4.1.3 强度误差(Intensity Related Error).15 4.1.4 远距离-高精度矛盾(Trade-off between range and precision).15 4.1.5 高频驱动.15 4.1.6 片上集成.16 4.2 d-ToF 挑战.16 4.2.1 暗计数率(Dark Count Rate,DCR).16 4.2.2 光子探测效率(Photon Detection Efficiency,PDE).17 4.2.3 串扰(Cross talk).17 4.2.4 时间精度.18 4.2.5 SPA
3、D 阵列 3D 集成.18 5 ToF发展方向.18 6 ToF技术应用.20 7 总结.22 8 参考文献.23 4 1 3D 视觉介绍 3D 视觉技术能够获取现实三维场景完整的几何信息,利用带有深度信息的图像来实现对于场景的精准的数字化,从而实现高精度的识别、定位、重建、场景理解等机器视觉的关键功能。以 2010 年的 Kinect 和 2017 年的 iPhone X 的发布为标志,3D 视觉技术从传统意义上只应用于专业领域的高端技术变成了消费级产品。Figure 1-1 二维空间到三维空间示意图。现行专业级或者消费级的 3D 相机采用两种主流技术,三角法(Triangulation)和
4、飞时法(Time-of-Flight,ToF)1。采用三角法的 3D 视觉技术包括双目技术和结构光技术,基本原理采用三角几何视差来获得目标到相机的距离信息。这种方法在近距离有着很高的精度,但是误差会随着距离增大而快速变大。ToF 技术测量相机是指主动投射出的光束经过目标表面反射后被相机接收这个过程的来回的飞行时间,基于光速即可获得目标到相机的距离。ToF 技术在不同距离的误差相对三角法更稳定,在远距离有着更好的精度2。在本文中,我们将介绍消费级的3D视觉技术的主要技术路径。针对ToF技术,我们将介绍其主要实现方法的具体工作原理,各自的优劣势以及技术挑战。根据行业的现状,我们将结合学术界的最新成
5、果,介绍解决当前 ToF 相机痛点的一些方法。最后,我们也将结合现下行业需求,介绍 ToF 的一些重要的应用场景。5 2 3D 视觉方案介绍 常见的3D视觉方案主要包括双目、结构光和ToF三个技术方向。这三种方法各有优劣。虽然本文主要介绍的是 ToF 技术,本章节将简要地介绍和比较其他两种技术方案,帮助读者全面地了解 3D 视觉技术方案。2.1 双目技术 双目深度重建利用的是三角测距法计算被测物体到相机的距离。具体的说,就是从两个相机观察同一物体,被观测物体在两个相机中拍摄到的图像中的位置会有一定位置差。正如将一只手指放在鼻尖前,左右眼看到的手指位置会有一个错位的效果。这个位置差称为视差,被摄
6、物离相机越近,视差就越大;距离越远,视差就越小。在已知两个相机间距等相对位置关系的情况下,即可通过相似三角形的原理计算出被摄物到相机的距离。Figure 2-1 双目技术示意图。双目深度重建的原理虽然简单,但在实际使用中遇到了两个挑战:计算量大,依赖被摄物的纹理及环境光照。下面对这两个挑战分别展开介绍。要计算一幅图中每个像素的深度值,我们需要得到每个像素在两幅图中的一一对应关系。这个关系的建立通常是采用块匹配(block matching)的方法。具体的说,在一幅图中,以一个像素为中心,选取一个固定大小的窗口,在另一幅图中寻找最相似的窗口,从而得到该像素在另一幅图中的对应像素。块匹配算法有很高
7、的计算复杂度,其计算量正比于(),其中 N,M 为图像的行数和列数,W,H 为匹配窗口的宽和高,D 为匹配寻找最相似像素的范围。为了达到更好的效果,会采用一些更复杂的改进算法(如Semi-Global Block Matching,SGBM),这就更进一步提高了计算量和复杂度。鉴于此原因,业界常见的方法是将算法固 6 化到特制的ASIC芯片中,从而解决计算量的大的问题,但这一增加了额外的硬件成本和迭代变化周期。双目深度重建的另一大挑战是依赖于被拍摄物体的表面纹理和环境光照。利用双目原理重建表面没有任何纹理的物体时,例如拍摄一面白墙,会遇到无法找到匹配的对应像素的问题。另一方面,当拍摄环境的光照
8、很弱的情况下,例如黑灯环境下,匹配也会遇到很大的挑战。结构光技术为解决这两个问题提供了新的思路。2.2 结构光技术 结构光方案是一种主动双目视觉技术。每个结构光相机包括两个基本组件:一个红外激光投射端和一个红外摄像头。其基本思路是将已知的结构化图案投影到被观测物体上,这些结构化图案将根据物体的几何形状和拍摄距离而发生相应的形变。红外摄像头从另一个角度进行观察,通过分析观测图案与原始图案之间发生的形变,可以得到图案上各像素的视差,再根据相机的内外参恢复出深度。Figure 2-2 结构光技术示意图1。结构光方案可以看成双目方案的一种特例。已知的投射端结构化图案和红外摄像头拍摄到的图案可视为左右双
9、目的观测。结构光重建算法和双目重建算法采用了相似的思想,也面临着类似的挑战,主要包括高计算量和深度突变处的数据缺失。为解决这两方面的挑战,光鉴创新地研发了一套高效软核重建算法,将计算量降低了两个数量级,只需一颗普通的 ARM 嵌入式处理器即可完成高精度深度重建。与此同时,利用多传感融合与深度学习,该算法大幅提升了常见的深度图缺失问题。7 和标准的双目方案相比,结构光方案更为鲁棒,这得益于结构光方案采用的主动光源和投射的结构化图案。具体的说,投射端发出的红外激光照亮了被拍摄物体,这使得拍摄端无需依赖环境光源即可获得亮度稳定的图像输入;另一方面,投射的结构化图案为被拍摄物体增加了表面纹理,这使得拍
10、摄表面没有任何图案的物体也能精准地重建出深度。2.3 双目、结构光及 ToF 技术比较 为了更直观的比较双目、结构光和 ToF技术路径的优劣势,我们汇总了各个每个方案的关键技术参数的比较。其中,i-ToF 和 d-ToF 技术将在之后的章节中具体介绍。双目 结构光 i-ToF d-ToF 适用场景 近距离 近距离 中远距离 中远距离 基本原理 三角测距 三角测距 相位测距 时间测距 Sensor RGB/IR CMOS IR CMOS i-ToF CIS SPAD Array 工艺难度 容易 容易 中等 难 传感器信号 模拟 模拟 模拟 数字 发射光脉冲 无 低频率 中高频率 高频率 测量精度
11、 近距离高,随测量距离平方下降 近距离高,随测量距离平方下降 与距离呈线性关系 在工作范围内相对固定 功耗 低 中 高 中 多路径串扰 容易解决 难度适中 较难解决 容易解决 量产标定 简单 中等 难 中等 8 3 ToF 基本原理 相比双目视觉和结构光方案,ToF 的方案实现起来会相对简单,主要包括发射端和接收 端,ToF 传感器给到光源驱动芯片调制信号,调制信号控制激光器发出高频调制的近红外光,遇到物体漫反射后,接收端通过发射光与接收光的相位差或时间差来计算深度信息。现大部分 ToF 传感器采用背照式 CMOS 工艺技术,该工艺大幅度提高了感光面积,提升了光子收集率和测距的速度,响应时间能
12、够达到纳秒级,在远距离情况下也能保证高精度。3.1 i-ToF 原理 i-ToF,即 indirect ToF,通过传感器在不同时间窗口采集到能量值的比例关系,解析出信号相位,间接测量发射信号和接收信号的时间差,进而得到深度。i-ToF 根据调制方式的不同,可分为两种:连续波调制(CW-iToF)和脉冲调制(PL-iToF),分别发射连续的正弦信号和重复的脉冲信号;前者是通过解析正弦信号相位解析深度,而后者是解析脉冲信号相位来解析深度。3.1.1 连续波调制(CW-iToF)通常采用正弦波调制方式,接收和发射端正弦波的相位偏移和物体距离摄像头的距离成正比,通过相位偏移来测量距离 !#=atan
13、.$%&1 =2!#2 (+)*+,-相位偏移()和 深度(D)是由积分能量值C$、C&、C%、C从上述公式解析得到,这几个积分能量值,是四个不同相位延迟的接收窗口采集到的能量,分别对应于在相位采样点0、90、180、270 采样,即:$=()&=(+90)=()%=(+180)=()=(+270)=()其中 A 为接收到正弦信号的幅度。9 精度方面,CW-iToF 精度主要受制于随机噪声和量化噪声,前者与接收光信号信噪比(Signal to Noise Ratio,SNR)成反比,后者与正弦波调制频率成反比。因此,为了提升精度,CW-iToF 一般采用大功率短积分时间采样,提高接受光信号 S
14、NR;同时提高调制频率以抑制量化噪声。量程方面,CW-iToF 可解析的相位范围为02,因此其最大量程为(/0=1&*!。即,频率越高,精度越高,量程也越小。超过量程的深度,将出现周期性的相位卷绕(Phase wrap),测量值错误的落在0(/0内。Figure 3-1 CW-iTOF工作示意图3。3.1.2 脉冲调制(PL-iToF)在 PL-iToF 系统中,激光光源发射带有振幅信息 和时间2 的光脉冲,根据光的飞行速度,可计算得到最远探测距离 345=2/2。反射光信号、背景光以及探测器的噪声集成在三个不同时间段内。PL-iToF 通过双采样技术提高精度,同激光脉冲同步的第一个窗口6,同
15、激光信号正交的第二个窗口$,是累积反射光信号的两部分,且每个窗口与目标距离成比例;第三个窗口7 在没有光脉冲发射时开启,仅收集背景光信号。如果6,$,7 分别表示在窗口6,$,7 的光子数,目标距离,接收到的有效光强度8,背景光 可由以下公式得到 =c 92($76+$2 7)8=6+$2 79 =72 10 Figure 3-2 PL-iToF的基本工作原理4。3.1.3 CW-iToF 与 PL-iToF 对比 CW-iToF 在工作过程中,不论目标物体的距离是多少,系统都采集了完整时长的反射光。相比之下,PL-iToF 在两个窗口内采集的信号的信噪比与距离直接相关。在有背景噪声的情况下,
16、如果目标距离的很近,$窗口的能量几乎为零,因此,$信噪比非常差;类似的,在较远的距离,6中的信号很弱,导致6的信噪比差。这种效应会导致 PL-iToF 在近和远距离都有比较大的误差。相比 CW-iToF连续波调试方式,PL-iToF 解算深度更简单、计算量更低,对于平台后端处理能力要求也相应更低。然而,PL-iToF 的精度取决于发光次数,发光次数越多,精度越高,但同时也会带来功耗的增加。即使在相同平均功耗的情况下,PL-iToF 不仅精度弱与CW-iToF,而且对于背景噪声和暗噪声更加敏感5。因此,现下的主要手机厂商,包括华为、三星、Oppo 等,以及 ToF 芯片厂商,包括索尼,三星,英飞
17、凌等都采用了 CW-iToF 的方案。3.2 d-ToF 原理 d-ToF 即 direct ToF,相比于 i-ToF 技术用测量信号的相位来间接地获得光的来回飞行时间,d-ToF(direct Time-of-Flight)技术直接测量光脉冲的发射和接收的时间差。由于激光安全的限制以及消费类产品的功耗限制,ToF 相机发射的脉冲能量有限,但是需要覆盖完整的视场区域。光脉冲在经过反射回到接收器时,能量密度降低了超过一万亿倍。于此同时,环境 11 光作为噪声,会干扰接收器对于信号的检测和还原。在这种情况下,探测器获取的信噪比不足以直接还原脉冲的模拟信号,进而导致直接测量深度存在很大的误差。因此
18、,d-ToF 方法需要有灵敏度极高的光探测器来检测微弱的光信号。单光子雪崩二极管(Single Photon Avalanche Diode,SPAD)具有探测单个光子的灵敏度。SPAD 在工作状态是一个偏置了高逆向电压的二极管。反向偏压在器件内部形成了一个强大的电场。当一个光子被 SPAD 吸收转化为一个自由电子时,这个自由电子被内部的电场加速,获得足够的能量撞击其他原子时产生自由电子和空穴对。而新产生的载流子继续被电场加速,撞击产生更多的载流子。这种几何放大的雪崩效应使得 SPAD 具有几乎无穷大的增益,从而输出一个大电流脉冲6,实现对于单个光子的探测。Figure 3-3 SPAD雪崩效
19、应示意图.(a)雪崩二极管示意图,光子在吸收区被吸收,转化为自由电子。自由电子在穿过PN结的过程中被电场加速。在获得足够能量时,在放大区产生雪崩效应,使得器件输出一个大电流脉冲。(b)SPAD的CMOS示意图。具体的、结构参数取决于器件采用的CMOS工艺。7 d-ToF 技术采用 SPAD 来实现高灵敏度的光探测,并且采用时间相关单光子技术方法(Time-Correlated Single-Photon Counting,TCSPC)来实现皮秒级的时间精度8。光脉冲的第一个被 SPAD 捕获的光子即可出发 SPAD,产生电流脉冲信号。系统的时间数字转换器(Time-to-Digital Con
20、verter,TDC)可以转换这个电流脉冲相对于发射时间的延时。SPAD 捕获一段脉冲内哪一个瞬间到达的光子具有一定的随机性,这种随机性的概率与光脉冲在该瞬间的能量近似成正比。因此,d-ToF 相机重复很多次(比如数千次)发射和探测相同的脉冲信号即可获得每次探测的电流脉冲延时的统计分布。这个统计直方图即恢复了发射脉冲能量随着时间的变化,进而得到了脉冲来回的飞行时间。12 Figure 3-4 TCSPC方法.系统控制激光器发射出激光脉冲,通过光学系统投射到目标物体表面。反射回的光脉冲被接受器的光学系统成像到d-ToF传感器上。光脉冲触发SPAD,输出电流脉冲。TDC根据电流脉冲的时间来输出数字
21、化的脉冲时序。一次成像会重复几千到几十万次的脉冲,从而获得TDC输出的统计直方图,重建光脉冲及获得飞行时间。9 4 ToF 技术挑战 4.1 i-ToF 挑战 在实际应用中,i-ToF 技术面临着诸多的挑战,真实环境的复杂多变,给深度测量引入了大量的干扰和噪声。这也是 i-ToF 技术提出已经有数十年的时间,但实际应用却十分有限的主要原因。本章节对 i-ToF 技术面临的诸多问题进行简要的原理定性分析。4.1.1 飞点噪声(Flying pixels)在 i-ToF 测量的深度图中,物体边缘处往往存在大量错误的深度测量值,生成 3D 点云后,视觉上表现为飞在空中的无效点(如 Figure 4-
22、1 所示),称为飞点噪声。飞点噪声使得 i-ToF 无法有效获取物体边缘的 3D 信息,这也是当下 i-ToF 能否得到广泛应用的一大挑战。Figure 4-1 典型的i-ToF测量点云,边缘处存在飞点噪声 13 如 Figure 4-2 所示,飞点噪声产生的主要原因在于:i-ToF 传感器上,每个像素都具有一定的物理尺寸,在测量物体边缘时,单个像素会同时接收到前景和背景反射回来的光线;二者产生的能量叠加在一起,使得传感器获取的原始数据中包含多个距离的信息,使用 3.1节原理解算相位计算距离时将得到错误的深度测量值。另外,镜头散射及像素间串扰,有时也会引起飞点噪声,甚至造成背景的大范围变形10
23、,11。通过边缘检测等图像算法12,可以在一定程度上检测并去除边缘飞点噪声,但对散射和串扰引起的变形难以根除,同时,误检也会造成大量有效深度测量值的丢失。Figure 4-2 飞点噪声产生原理示意图:ToF传感器上的蓝色像素仅接收到单一深度信息(前景 or 背景),可以获取正确的测量值(蓝色点);ToF传感器上的绿色像素同时接收到前景和背景反射的光线,两个深度信息叠加在一起无法区分,iToF测量得到错误的深度值(橙色点)。4.1.2 多径干扰(Multi-Path Interference,MPI)真实场景中存在复杂的漫反射甚至镜面反射,MPI 在原理上会使得测量值变大,严重影响三维重建的效果
24、。14 Figure 4-3 多径干扰产生原理示意图:图示以测量墙角为例,投射模块投向左边的光线(虚线)经两次反射,与投向右边的光线(实线)同时被ToF传感器接收到。双重的深度信息导致ToF测量值错误.以 Figure 4-4 的场景为例,投向桌面的光线经标准件二次反射后被 i-ToF 传感器接收到,MPI效应导致测量到的标准件形状扭曲;投向标准件的光线经桌面二次反射后被i-ToF传感器接收到,MPI 效应导致桌面测量值的错误,桌面近似于一个镜面,桌面测量值接近于标准件的镜像。Figure 4-4 多径干扰示意图:多径干扰导致标准件测量点云形状扭曲(绿色),以及桌面错误地测量成标准件镜像(红色
25、)MPI 是困扰 i-ToF 多年的重要问题,一直是 i-ToF 广泛应用的最大障碍。在过去的十年中,微软,MIT,Waikato大学等诸多研究机构在解决MPI问题上做出了大量算法和系统层面的尝试13,但仍无法根除该问题。15 4.1.3 强度误差(Intensity Related Error)在 i-ToF 传感器测量到的深度图上,存在一类特殊的误差,即同一平面上不同反射率的区域体现出不同的深度,如 Figure 4-5 所示。Figure 4-5 强度误差示意图,同一平面上不同反射率区域呈现不同深度,黑色和灰色区域从平面上凸起14。i-ToF 的强度误差与距离、反射率、积分时间等因素都存
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- ToF 深度 相机 技术 白皮书
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【宇***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【宇***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。