基于无镜头成像的目标检测分类方法.pdf
《基于无镜头成像的目标检测分类方法.pdf》由会员分享,可在线阅读,更多相关《基于无镜头成像的目标检测分类方法.pdf(4页珍藏版)》请在咨信网上搜索。
1、物联网技术 2023年/第12期 全面感知 Comprehensive Perception260 引 言随着信息技术的进步,相机和其他成像设备的使用出现了爆炸式增长,越来越多的成像模块被集成到手机、电脑和其他物联网设备中。随着相机的使用和集成的增加,同时结合神经网络的发展,它们在我们生活中的作用也发生了显著的变化。大多数相机不再仅仅用于拍照,而是作为传感器,为生物识别、目标分类检测、安防监控等应用提供数据支持1-3。虽然现代相机模块的厚度可以达到约 5 mm,且成本低廉。但许多物联网(Internet of Thing,IoT)新兴应用对体积、重量和成本都有着十分严格的限制,这是当今基于镜头
2、成像系统所无法满足的。近些年来,随着人们对新型成像技术的要求和计算成像技术的兴起,无镜头成像取得了显著进展4-6。通过使用特定光学器件代替传统透镜可以将相机的重量和体积减少一个数量级,同时成本也更低廉,比如 FlatCam 无镜头相机的厚度仅有 0.5 mm7,可以更好适配于物联网应用对成像设备的要求。本文分析了编码掩膜无镜头成像的基本原理,并介绍了基于 Tikhonov 正则化的重构方法。同时,联合卷积神经网络,提出了基于无镜头成像的目标检测分类方法。1 编码掩膜无镜头成像编码掩膜无镜头成像技术早期在高能天文学中被广泛研究,主要应用于非可见光波长的成像8-9。其主要思想是使用一个包含多个子孔
3、径的轻型光学器件来代替传统相机中的透镜,实现对空间中光线的调制。该光学器件上子孔径的位置可以被编码,因此也被称为编码掩膜。根据对光线调制作用的不同,编码掩膜可以分为振幅调制器和相位调制器,本节主要研究振幅调制的编码掩膜无镜头成像方法。1.1 成像模型编码掩膜无镜头成像的成像系统主要由数据捕获和计算成像两部分组成,其结构如图 1 所示。来自场景的光线通过编码掩膜调制后,被图像传感器捕获。与传统相机不同的是,无镜头成像系统中传感器的测量值并不是场景点强度的直接测量,而是多个光源通过编码掩膜投影后的叠加。因此,需要在计算成像部分使用相应的重构算法,对传感器测量值进行解码操作,从而实现原始场景的重构。
4、图 1 编码掩膜无镜头成像示意图考虑使用图 2 所示的几何模型来表示编码掩膜系统中传感器测量值与场景中光源的相互作用。为了方便解释,以一维情况为例,设定场景为一维光源阵列,传感器也为一维平面。假设掩膜是无限薄的元件,其折射效应可以忽略。一维场景、传感器与掩膜彼此平行。在这种情况下,光从光源到传感器元件的路径是一条直线。设传感器与掩膜之间的距离为 d,场景平面与传感器之间的垂直距离为 D。从位置 s0的点光源到位置 u 处的传感器像素的光线,根据几何关系计算可知,该光线与掩膜平面基于无镜头成像的目标检测分类方法姜继兴,钱 慧(福州大学 物理与信息工程学院,福建 福州 350116)摘 要:为了适
5、应新型物联网设备对于小体积的要求,提出一种基于无镜头成像的检测分类方法。基于摄像头的计算机视觉处理任务目前已可集成到各种硬件设备中,然而随着物联网技术的快速发展,笨重的镜头已无法满足小体积的要求。无镜头成像技术是一种新型成像技术,其通过编码掩膜取代传统相机镜头而大大减小了相机体积和成本。本文通过分析无镜头成像基本原理与图像重构方法,并将其与神经网络联合,实现了基于无镜头成像的目标检测分类。实验使用 VGG19 网络进行了测试,证明了该方法的可行性。关键词:新型物联网;无镜头成像;目标检测分类;编码掩膜;图像重构;神经网络;VGG19中图分类号:TP391 文献标识码:A 文章编号:2095-1
6、302(2023)12-0026-03DOI:10.16667/j.issn.2095-1302.2023.12.007收稿日期:2023-02-08 修回日期:2023-03-092023年/第12期 物联网技术全面感知 Comprehensive Perception27的交点位置为 u+(s0-u)d/D。使用 x(s)表示位于场景位置 s处的点光源强度,T(s)表示位置 s 处的掩膜透射率函数,使得在该位置处与掩膜相交的光线会在振幅上有不同程度的衰减。忽略噪声影响,对于位置 u 处的传感器像素测量值y(u),有:y ux s T usudDss()()()=+d (1)图 2 编码掩膜
7、无镜头成像几何光路图式中,积分范围为所有能够到达该位置传感器像素的光线,由传感器视场角决定。将该模型拓展到 2D 模式,可得:y ux s t T usudDvtvdDt sts()(,)(),()=+d d (2)整体上可以将其看作一个线性变换。将传感器测量值 y和场景光源 x 进行离散化并加入噪声,可将式(2)改写成如下形式:yxe=+(3)式中:x RN1表示实际场景强度;y RM1表示图像传感器测量值;e 表示噪声。RMN表示系统传输矩阵,传输矩阵的每一行表示场景各点光源对应点像素测量值的贡献程度,传输矩阵的每一列表示对应位置处点光源的点扩散函数(Point Spread Functi
8、on,PSF)。如果场景只包含单个光源,则会在传感器上形成对应列所表示的图案。式(3)表明,编码掩膜无镜头成像系统中,单个测量值不再是场景中单个光源的一对一映射,而是来自场景中所有光源的多路复用光。如果使用可分离掩膜10,即使用可分离的 2D 图案作为掩膜,从而产生传感器测量值与实际场景强度之间的可分离关系。此时,2D 掩膜图案矩阵可以表示成两个一维向量的外积。TTT(,)()()LRi jij=(4)式中:TR(i)、TL(j)分别表示左右分离一维向量。式(3)可以改写成如下形式:y u vx s tusudDvtvdDt sts(,)(,)()()LRL=+=TTTd du usudDvt
9、vdDx s ttsst+()()(,)RTdd(5)内部积分对场景的一行进行 1D 的编码掩膜成像,而外部积分则对场景中的一列进行 1D 的编码掩膜成像,形成可分离的场景变换。通过将上述积分离散化并加入噪声,就可以将方程(3)表示成可分离编码掩膜成像模型,即:YX=+LRTE (6)式中:L、R分别表示对应于沿场景的行和列的一维卷积矩阵,即=LR,其中,表示克罗内克积;X 是包含场景辐射的NN矩阵;Y是包含传感器测量值的MM矩阵;E 表示噪声。对于大像素场景和百万像素传感器而言,L和R分别有 106个元素,而 会有 1012个元素,可以极大减少传输矩阵的数据量。1.2 重构方法对于可分离掩膜
10、模型,场景的重构就是公式(6)的逆过程,即从测量值 Y 中恢复出原始场景光强度分布 X,这是逆线性问题的求解。对于这一求解过程,如果可以得到精确的左右变换矩阵 L和 R,则只需进行简单的矩阵逆问题求解即可。然而可分离掩膜模型是一种近似模型,它可能偏离真实的物理系统。这是因为物理 PSF 并不是严格意义上的掩膜图案本身。例如,由于衍射效应和噪声,光可能到达被完全不透明的元素阻挡的像素。因此,二维 PSF 可能不完全是两个一维 PSF 的外积。此外,掩膜若未与传感器完美对准,也会使得物理模型与可分离模型失配。因此,在使用可分离模型时,需要提前进行多次数据标定与校准,使得得到的左右分离矩阵尽可能近似
11、于真实模型,文献 7 中提供了校准过程的详细说明。通过校准测定获得左右变换矩阵 L和 R的近似值后,可以通过求解最小二乘问题,从测量值中实现对原始光强度分布的求解,即:XYX=argminLRX 22 (7)因为测定的左右变换矩阵不一定是良态矩阵,为保证重构算法的可靠性,可以在式(6)中添加 Tikhonov 正则化项来提高重构质量,即:XYXX=+argminLRX 2222 (8)上述问题的封闭形式解7可以导出为如下形式:X=+VU YUVLLTLTRRLRTTRT()./()11 (9)式中:L=ULLVLT和 R=URRVRT分别表示左右变换矩阵 L和 R的奇异值分解;L和 R分别为包
12、含 L2和 R2中对角线元素的向量;./表示按元素点除。将重构算法分别应用于彩色图像的每个通道,就可以实现 RGB 图像的重建。2 神经网络联合随着计算机算力的飞速提升以及大数据的发展,神经网络在机器视觉领域展现出巨大的潜力。神经网络可以分为许多种类。其中,卷积神经网络是最具代表性的一类,其在目标检测分类、目标识别、图像重构等任务中发挥了重要作用。物联网技术 2023年/第12期 全面感知 Comprehensive Perception28VGGNet11是牛津大学计算机视觉组提出的一种应用于图像分类的经典网络,其主要由卷积层、池化层和全连接层构成。根据卷积层数量的不同,还可以分为 VGG1
13、6 和VGG19,本文将主要利用 VGG19 对无镜头成像后的图像进行检测分类,以验证基于无镜头成像的目标检测分类方法可行性,其整体流程如图 3 所示。对于网络的训练与测试,本文所使用的数据集为经过无镜头方法处理后的ImageNet数据集12,其包含 1 000 个不同种类的图像及相对应无镜头传感器测量值。使用公式(9)重构的图像尺寸为 2562563,将其经过裁剪之后使用 2242243 的尺寸进行网络训练和测试。图 3 基于无镜头成像的目标检测分类流程3 仿真实验结果3.1 无镜头成像仿真结果图 4 所示为使用无镜头相机处理后的 ImageNet 数据集进行场景重构的仿真实验结果。该数据集
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 镜头 成像 目标 检测 分类 方法
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。