局部相位量化在模糊图像识别中的研究进展.pdf
《局部相位量化在模糊图像识别中的研究进展.pdf》由会员分享,可在线阅读,更多相关《局部相位量化在模糊图像识别中的研究进展.pdf(6页珍藏版)》请在咨信网上搜索。
1、局部相位量化在模糊图像识别中的研究进展刘靖丹,逯 洋,王 淳(吉林师范大学 数学与计算机学院,吉林 四平 1 3 6 0 0 0)摘 要:现代图像处理技术的不断发展,为人们提供了大量丰富的图像信息。图像处理手段很多,如图像去噪、图像平滑、图像去模糊、图像填充、图像分割等。处理模糊图像问题最具代表性的算法是局部相位量化(L o c a l P h a s e Q u a n t i z a t i o n,L P Q)和基于局部二进制模式(L o c a l B i n a r y P a t t e r n,L B P)的算子。与L B P特征算子相比,L P Q特征算子对图像模糊不敏感,其特
2、征提取更加稳定。从介绍L P Q算子开始,首先对L P Q算子的发展现状和应用领域进行分类和总结;其次详细阐述和评论每种实验方法;最后思考和讨论L P Q算子的发展方向。关键词:局部相位量化;模糊图像识别;人脸识别中图分类号:T P 3 9 1.4 1 文献标识码:A 文章编号:2 0 9 5 9 6 9 9(2 0 2 3)0 3 0 0 0 6 0 6 图像处理技术是利用计算机处理图像来进行科学研究的一门新兴科学。图像处理技术1的研究内容十分广泛,包括图像处理的基础,图像处理的研究方法等。图像处理技术的主要内容之一是图像识别。图像识别在图像采集过程中容易受到干扰(如尺度2、光照3或噪声4等
3、),使得这项工作具有极大的挑战性,在其领域中一个较少被研究的性质是模糊5-6。环境中运动和大气湍流、低质量的图像系统很可能会产生图像的模糊不清。模糊图像会使图像效果恶化,对图像数据的收集造成障碍。所以,模糊图像特征辨识的方法有着重大研究价值,已成为有关学者探讨的焦点问题而受到了普遍重视。对此,2 0 0 8年V i l l e O j a n s i v u7提出了一种用于纹理描述的模糊不敏感纹理分类方法,称为局部相位量化(L P Q)。该方法已经被证明比L B P算子8-1 0对模糊的容忍度更高。之后T i m o A h o n e n1 1将此方法引用到模糊人脸识别领域,大大提高了人脸识
4、别效率,同时提高了图像处理的效率。后来L P Q算法在人脸识别领域中被不断改进,在局部特征提取方面取得了很好的效果,获得了很大的成功。L P Q算法也被应用于其他领域,如手势识别、面部识别和掌纹识别等。因此,有必要对该方法的相关研究成果进行全面的综述和讨论。本文系统综述了局部相位量化方法在处理模糊图像上的研究进展,进一步深入研究局部相位量化并以求为拓展其应用领域奠定基础。本文从介绍L P Q算子的起源开始,阐述了不同实验研究的动机、原理、优缺点,揭示了各种方法之间的差异和联系,最后思考了该方法的发展方向。1 模糊不变的局部相位量化方法模糊不变的局部相位量化方法的优势有以下五点:(1)在处理图像
5、时不需要加入特征点;(2)不需要对图像进行分类;(3)不需要新建模型,对已有的旧模型进行训练,计算结果与模型的性能指标保持一致;(4)可以作为快速处理的对象和模型;(5)在处理过程中具有可扩展性。在L P Q方法中,可以直接在计算机上用L P Q方法对图像进行分类。第3 8卷 第3期2 0 2 3年6月 景德镇学院学报J o u r n a l o f J i n g d e z h e n U n i v e r s i t y V o l.3 8 N o.3 J u n.2 0 2 3 收稿日期:2 0 2 3-0 5-1 0基金项目:吉林省发展和改革委员会创新项目(2 0 2 1 C 0
6、 3 8-7);吉林省创新创业人才基金(2 0 2 3 QN 3 1);吉林省自然科学基金(Y D Z J 2 0 2 3 0 1 Z Y T S 1 5 7)作者简介:刘靖丹(1 9 9 9-),女,吉林长春人,在读硕士研究生,主要从事图像纹理识别方面的研究。通信作者:逯 洋(1 9 7 9-),女,吉林四平人,教授,博士,博士研究生导师,主要从事机器学习与数值模拟方面的研究。基于二维离散傅里叶变换1 2(D F T)的L P Q算子,使 用 短 期 傅 里 叶 变 换(S h o r t-T e r m F o u r i e r T r a n s f o r m,S T F T)计算像
7、素点局部邻域内的相位信息。1.1 离散傅里叶变换(D F T)在数字图像处理中,模糊图像g x 可以通过原始图像f x 和点扩散函数(P S F)卷积构成,其表达式如下:g(x)=(f*h)(x)(1)将其进行傅里叶变换转变到频域,则式(1)转化为:G(u)=F(u)H(u)(2)其中G u ,F u 和H u 分别是g x 、f x 和h x 进行离散傅里叶变换(D F T)后的结果。可以将(2)式的幅值和相部分开,得到如下相位关系表达式:G u =F u H u 和G(u)=F(u)+H(u)(3)假设模糊点扩散函数h x 是中心对称的,即h(x)=h(-x),如果傅里叶变换总是得到实值,
8、那么它的相位只是一个二值函数,如式(4)所示:H u =0H,u 0 H,u 0 (4)对于规则的点扩散函数,使得当所有H(u)0时都有:G(u)=F(u)(5)这一关系就为模糊不变特征提取奠定了理论基础。1.2 短期傅里叶变换(S T F T)S T F T是由(6)式定义的f x 的每个像素位置x处的MM邻域Nx上计算的,其中Wu是频率u的二维D F T的基向量,fx是另一个包含来自Nx的所有M2图像样本的向量。F u,x =yNxf(x-y)e-j2 uTy=WTufx (6)可以看出,实现S T F T的一种有效方法是对所有u使用二维卷积。4个频点u1=a,0 T,u2=0,a T,u
9、3=a,a T,u4=a,-a T通过局部傅立叶系数计算,a表示范围很小,a=1/M。每个像素位置通过向量表示,如式(7)所示:Fx=F u1,x ,F u2,x ,F u3,x ,F u4,x (7)傅里叶相位系数可使用各部分的实数和虚数的符号来表达,如式(8)所示。qj=1,gj0,0,gj0 (8)gj是向量G x =R e(Fx),I m(Fx)的第j个部分。然后qj对其进行二进制编码,如式(9)所示。fL P Qx =8j=1qjx 2j-1 (9)L P Q(x)表示窗口尺寸为MM的算法,图1中是窗口为55的L P Q算法实例。图1 L P Q算法2 L P Q算子的研究概况2.1
10、 针对灰度图像的L P Q算子及变体L P Q算法大多针对灰度图像,研究内容大多是以人脸和纹理图像为研究对象来进行归纳。不同的实验 研 究 使 用 了 不 同 的 数 据 集,包 括O u t e x、YA L E、A R和O R L等。2.2 对单一图像模糊不敏感纹理分类方面的研究V i l l e O j a n s i v u等人7提出了一种用于纹理描述的模糊不敏感纹理分类方法,称为局部相位量化。其研究重点是模糊不敏感的纹理分类,相比之下,L P Q比L B P对模糊的容忍度更高。T i m o A h o n e n等人1 1将L P Q算子用于模糊人脸的识别,通过向L P Q添加一个
11、去相关来达到要求。通过对不同区域直方图的连接,完成人脸的全局描述,提高了算法识别率。朱长水等人1 3提出将局部 二值模式和L P Q进行融合的人脸识别方法,具体算法如图2所示。该方法比较直方图的相似性,根据最近邻原则进行识别,提高了算法的鲁棒性。图2 L B P/L P Q算法7第3期 刘靖丹,逯 洋,王 淳:局部相位量化在模糊图像识别中的研究进展 X i a o等人1 4提 出 局 部 相 位 量 化 加(L P Q+),将L P Q嵌入到F i s h e r向量(F V)中,利用F V增强模糊图像识别性能,并且L P Q+直接量化S T F T的局部相位。该方法有更强的局部模式表征能力,
12、可以提高模糊图像的识别性能。Z h u等人1 5对L P Q+进行改进,提出一种判别模糊不敏感的纹理描述符,称为局部相位量化加加(L P Q+)。该方法是在S T F T产生的归一化模糊不敏感特征映射之间,建立空间信道相互作用以增强描述能力,同时保持对模糊的不敏感。陈晓文等人1 6提出用高斯拉普拉斯边缘检测和局部相位量 化增强结 合的模 糊 图 像 识 别 算 法M r E L P Q和M s L o G(M u l t i-r e s o l u t i o n E L P Q a n d M u l t i-s c a l e L o G)。通过正负量化和幅值量化的操作,得到具有互补符号特
13、征的E L P Q_S和幅值特征的E L P Q_M,将特征直方图进行串联,得到增强的局部相位量化模式,该算法增强了模糊的鲁棒性,并且具有更好的识别性能。O j a n s i v u等人是最早专门针对模糊图像进行研究的,后来的研究者都是以他们的研究为依据不断改进,以达到更好的效果。这是当时最具代表性和最具影响力的研究成果,也为识别模糊图像打开了新篇章。A h o n e n是首个将L P Q方法应用于人脸识别领域的,研究成果是L P Q算法应用人脸识别领域的开端。他的实验巧妙地在L P Q上使用去相关来进行改进算法,最后发现L P Q不仅可以很好地处理模糊,而且可以很好地处理现实图像中的其他
14、干扰,实验更加验证了L P Q在识别模糊图像上的优越性。朱长水基于A h o n e n的实验进行画面分块,发现这个技术还存在着一定的局限,需要重复试验计算以确定最合适的大小来达到较好的识别率。以上实验都是针对简单的模糊图像,遇到复杂的图像时,只通过L P Q单一方法不容易得出好的结果。X i a o等人创新了人脸识别方法,借助F V在B o W模型中获得新的模糊图像,改变L P Q对S T F T操作过程,从而获得更强的局部表征能力。同时针对多种不同数据集进行试验,做了大量改进工作,实验结果很好,但主要问题是对不同纹理的辨别能力没有得到充 分利用。Z h u等人发现L P Q+忽 略 了S
15、T F T特征图中不同频率点之间的空间和通道相关性,可能导致某些具有内在价值的纹理线索被忽略,所以进行再次改进,过程中发现归一化S T F T系数特征图之间的通道梯度可以从本质上帮助区分特定图像中的边缘和平坦区域,这对于模糊纹理的识别是至关重要的。2.3 结合旋转变化和图像模糊不敏感纹理分类方面的研究图像去模糊工作复杂且困难,为预防图像处理工作受到其他外部因素的影响,V i l l e O j a n s i v u等人1 7提出一种新的模糊和旋转不敏感纹理描述子,称为旋转不变局部相位量化(R I L P Q)方法,是对模糊不敏感的L P Q纹理描述子进行旋转不变的扩展。通过估计局部特征方向并
16、计算有向二值描述子,使其在旋转模式下表现更好。2.4 结合尺度变化和图像模糊不敏感纹理分类方面的研究图像处理过程容易受到尺度变化的影响,朱长水等人1 8提出尺度不变特征转换(S I F T)和L P Q结合的人脸图像识别方法。S I F T算法检测并获取所有人脸图像特征点,统计所有特征点邻域的L P Q数据并显示成直方图序列,该方法是计算特征点邻域距离比得到的,在尺度、旋转、明暗等方面存在着一定的鲁棒优势,具有较好的识别效果,能有效降低面部信息的维度。提取的特征点主要集中在眼睛、鼻子和嘴巴上,这些点与面部特征相匹配,可以实现快速识别。以上基于L P Q方法的优缺点及其工作原理,如表1所示。2.
17、5 针对彩色图像的L P Q算子上述实验数据集大多是对灰度图像进行识别,而现如今获取到的人脸图像多为彩色图像,一些研究者会将彩色图像转化为灰度图像,这也将大大增加工作量,更加费时费力。想要实现符合现代的人脸识别技术,M a t t e o P e d o n e等人1 9提出针对处理彩色图像的L P Q描述符的扩展方法,该方法是利用颜色值的多向量表示得到的,是一种基于克利福德代数的L P Q描述子颜色扩展方法,该方法在模糊和非模糊纹理分类中具有较好的鲁棒性。L P Q描述符仅限于灰度图像,该描述子比灰度描述子和其他颜色纹理描述子具有更高的精度。此外,它的光照不变特性保证了在具有挑战性场景中的卓
18、越性能,而无需用颜色不变算法预处理纹理。该算法也解决了分类的图像可能会经历的辐射失真、噪声和模糊等原因导致的退化。3 拓展L P Q方法应用领域上述内容研究领域单一,依据本身对模糊不敏8 景德镇学院学报 2 0 2 3年表1 基于L P Q方法的优缺点及其工作原理方法工作原理优点缺点文献L P Q基于 局 部 图 像 窗 口 计 算 的D F T的相位信息对模糊高度不敏感,对均匀光照变化也具有不变性窗口大小有限,这种理想的不变性没有完全实现7将标签图像划分成 合适的矩形区域,并在每个区域内独立计算标签直方图,利用连接起来的直方图建立全局描述对模糊的容忍度很高,在清晰图像上仍优于L B P-1
19、1L B P和L P Q融合将空域提取L B P特征和频域提取L P Q特 征 融 合 成L B P/L P Q直方图,进行直方图相似性比较,最后根据最近邻原则进行识别增强了对光照变化和噪声的 鲁 棒 性,能 够 获 得 比L B P或 L P Q更 好 的 识别率需要选择合适的窗口大小以及图像分块大小,这一过程需要多次实验1 3L P Q+将L P Q嵌 入 到F V中,利 用F V增强模糊图像识别性能有更 强 的 局 部 模 式 表 征能力辨别能力没有得到充分利用,忽略了特征图中频率点之 间 的 空 间 和 通 道 相关性1 4L P Q+在S T F T产生的归 一化模糊不敏感特征映射之
20、间,建立空间信道相互作用有更强的辨别能力,更有效地捕获到精细纹理图像-1 5M r E L P Q和M s L o G在图像的空间域使 用多尺度L o G算 子 提 取 图 像 的 边 缘特征增强了模糊的鲁棒性,有着更好的识别性能-1 6R I L P Q先估计局部特征方向,然后计算有向二值描述子在旋转模式下表现更好,在无旋转模式的情况下准确性也很高-1 7L P Q结合S I F T利用S I F T算法检测特 征点,得到特征点集合,将计算出的邻域特征表述为直方图序列对尺度、旋转、亮暗等图像变换具有一定的鲁棒性-1 8感的独特特征,一些学者将此算子拓展到其他领域,扩大了算法的通用性,以下内容
21、对此进行了列举。3.1 在掌脉识别中的应用在手掌静脉识别系统中,因为人类手掌生理构造特点易产生影像模糊,使得识别精度降低。林森等人2 0提出了基于子区域L P Q鲁棒识别问题的方法。通过建立一个L P Q特征提取模型,将掌脉图像分为几个子段,提取并集成每个分区的L P Q特征,最后利用卡方距离匹配识别。该方法具有良好的手掌图像模糊强度,有效提升了手掌静脉识别系统的性能。3.2 在人耳识别中的应用现实中获得的人耳图像数据往往具有不同程度的信号退化,最典型的信号衰减类型是模糊和热噪声。为改善这一问题,黄冠等人2 1比较人耳图像识别过程中三种不同的图像识别算法的影响,分别用到方向梯度直方图(HOG)
22、、L P Q和 L B P方法进行实验,经过对比L P Q算法对模糊性有很好的识别能力,L B P算法如图3所示。图3 L B P算法3.3 在车标识别中的应用贺敏雪等人2 2提出基于抗模糊特征的车标识别方法,以解决标识图像上的图像模糊问题。通过构建标志图像金字塔模型,利用L P Q算法提取车标图像的抗纹理和抗边缘模糊特征,并且使用典型相关分析(C C A)以促进后续的降维和分类。该方法结合两种抗模糊特征,具有较好的识别效果和较强的鲁棒性和抗模糊性。3.4 在森林火灾图像识别中的应用为减少森林大火的误报概率和提升火灾报警效率,李巨虎等人2 3提出火焰独特色彩和纹理特征的火焰识别算法,将L B
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 局部 相位 量化 模糊 图像 识别 中的 研究进展
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。