基于图像特征的人眼定位----学位论文.doc
《基于图像特征的人眼定位----学位论文.doc》由会员分享,可在线阅读,更多相关《基于图像特征的人眼定位----学位论文.doc(33页珍藏版)》请在咨信网上搜索。
1、兰州交通大学毕业设计(论文)内容摘要人脸识别是人类视觉最杰出的能力之一,它的研究涉及模式识别、图像处理、生理,心理学、认知科学,和基于其它生物特征的身份鉴别方法以及计算机人机感知学交互领域都有密切联系其中人眼的识别是计算机人脸识别和智能监控中的重要部分。本文所研究的人眼识别对象都是针对单人正面或半侧面图像。该文提出了一种基于最大类间方差阈值分割和灰度积分投影技术的眼睛定位方法。首先通过图像预处理技术中的中值滤波方法去除图像噪声,并通过非线性变换消除人脸图像因为曝光条件不同而造成的模糊,得到灰度分配较为均匀的图像,然后利用最大类间方差阈值法对图像进行二值化处理,将特征点从人脸图像分割出来,并分别
2、利用水平和垂直灰度积分投影曲线结合人脸的结构特征找到眼睛的位置坐标,实现了准确的眼睛定位,从而为进一步提取其它特征点打好了基础。关键词: 特征提取;眼睛定位;积分投影;阈值分割AbstractComputer face recognition is a very active area of research in recent years. Its applications range is very wide, such as identity authentication in safety system, video surveillance, target identificatio
3、n and tracking, as well as facial expression analysis, age analysis, lip reading and so on. compared with mouth and nose, Eyes are the most significant features of the face. which can provide more reliable, more important message, so eye detection is often necessary to dispose in face recognition. A
4、n algorithm for eyes location is presented in this paper based on maximum variance between two classes and gray- level integration projection. First, median filter is used to eliminate the noise, then the image blur caused by deficient exposal is cleared up using non - linear transform. Maximum vari
5、ance between two classes is provided to get the binary image, and then the features are extracted from the image. Finally, by the way of gray-levelinte gration projection and human face configuration, we can easily find that the location of eyes is determined by the coordinate of the minimum in the
6、diagram. Further feature detection can be done based on this result.KEYWORDS: Feature extraction; Eye location; Integration projection; Threshold segment目 录目 录3第一章 绪 论41.1 课题的背景和意义41.2 论文的主要内容7第二章 图像预处理基本知识92.1 图像灰度变换92.1.1 图像的灰度化102.1.2 图像灰度求反112.1.3 图像灰度拉伸122.2 图像平滑去噪132.2.1 概述132.2.2 图像噪声分类132.2.
7、3 图像系统噪声的特点142.2.4 均值滤波152.2.5 中值滤波162.3 直方图均衡化172.4 图像二值化19第三章 人眼定位算法223.1 算法流程223.2 人脸识别的常用方法243.3 投影法原理243.4 人眼左右边界的判定253.5 眉眼区域的判定263.6 眉眼区域的处理273.7 眼睛的精确定位28第四章 检测结果与分析29第五章 总结与展望305.1 总结305.2 算法的改进与前景31参考文献32致 谢33第一章 绪 论本章主要介绍了本文的研究背景和研究的意义,以及对本文的研究内容和各个章节的安排进行了介绍。1.1 课题的背景和意义人脸检测(Face Detecti
8、on)是指在输入图像中确定所有人脸(如果存在)位置与大小。人脸检测系统的输入是可能包含人脸的图像,输出是关于图像中是否存在人脸以及人脸的数目、位置、尺度、姿态等信息的参数化描述。检测任务的完成涉及从复杂的背景中分割、抽取、验证人脸区域和可能要用到的人脸特征(如眼角、嘴角等),成功的人脸检测系统应能处理实际存在的光线、人脸方向和离照相机距离变化等各种不同情况。人脸检测作为人脸信息处理中的一项关键技术,近年来成为模式识别与计算机视觉领域内一项受到普遍重视、研究十分活跃的课题。人脸检测问题的提出最早可以追溯到早期的人脸识别研究中对人脸定位的需求。一个完整的人脸自动识别系统至少要包含两个主要的技术环节
9、:人脸的检测和人脸的特征提取与识别。人脸检测是自动人脸识别系统中的一个关键环节,但是早期的人脸识别研究主要针对具有较强约束条件的人脸图像(如无背景人脸图像等),往往假设人脸位置己知或很容易获得,因此人脸检测问题未引起研究者的充分重视。近几年来,电子商务等网络资源的利用使得人脸识别成为最有潜力的生物身份验证手段,在这种应用背景下,要求人脸自动识别系统能够对一般环境图像具有一定的适应能力,由此所面临的一系列问题使得人脸检测作为一个独立的课题受到研究者的重视。今天,人脸检测的应用背景己经远远超出了人脸识别系统的范畴。随着网络技术和桌上视频的广泛采用,图像捕捉设备正在成为个人计算机的标准外设,为视频会
10、议等服务所急需的技术 基于内容的压缩与检索成为一个研究热点。人脸的检测是进行人脸压缩的前提条件,同时人脸也是基于内容检索的重要对象,因而人脸检测在这个领域中占有重要的地位。此外,人脸检测在智能化人机界面、视觉监测、数字视频处理等方面也有着重要的应用价值,这使得人脸检测的研究倍受关注。下面对人脸检测的一些应用领域做些简要的介绍:(1) 基于内容的视频检索随着因特网上应用的迅速增长,图像、视频、语音等多媒体信息的使用日益广泛,其数量也迅速膨胀起来。尤其是视频这种媒体,集成了影像、声音和文字,是一种综合媒体。它的非结构化的本质决定了传统的浏览和检索手段不适用于这种媒体。基于内容的多媒体信息检索就是在
11、这样的背景下提出的,并成为多媒体研究领域的一个热点。视频结构单元通常可以看作两层:镜头和场景。镜头是由相互关联的连续的视频组成。它描绘同一个场景,对应摄像机一次记录的起停动作,代表一个场景中时间和空间上连续的动作。在高层的内容分析、索引和分类中,镜头是基本的单元。场景包含有多个镜头,针对同一批对象,但拍摄的角度不同,传达的含义不同。经过分析视频结构单元间的关系建立视频内容语义进而形成有效的视频内容索引,这是支持有效的基于内容的视频检索的关键。显然,只有实现基于语义层次上的检索,结果才能接近用户所要检索内容的要求,所得的结果才能和用户对视频内容的表述一致,比如要检索“有乔丹参加的篮球比赛”的电视
12、节目。而对视频图像中的特定对象(如人或轿车等)的分析是形成语义结果的基础。(2)有关MPEG-7标准为解决对多媒体信息描述的标准问题,国际运动图像专家组于2001年,发表了国际标准MPEG-7,其全称为“多媒体内容描述接口”,其目标就是制定一组标准的描述子及其描述模式(定义描述子的结构和相互关系),内容描述与媒体内容结合,使用户能够快速准确地进行检索。它不是针对特定应用的,而是提供了灵活且可扩展的视听内容描述框架以实现各种传输媒体的共享访问和交换、强调基于内容的交互性、可重用性、可伸缩性。除此之外,人的面部表情、性格特征也是NPEG-7的数据类型之一。另外,MPEG-7标准组织已经建立了人脸识
13、别草案小组,人脸检测算法也是一项征集的内容。(3)基于内容的图像检索现在许多应用都集成了大规模的图像库,而且是其中的重要部分。基于内容的图像检索本质上是基于相似性的检索,最好是利用图像本身的特征,从所有的图像中找出与查询者要求最接近的一批图像。现在可资利用的相似性有全局颜色的相似性,形状的相似性,纹理的相似性等。而基于目标的相似性应该说是很有效的方法。比如,原本要检索一个有关小女孩方面的图像,检索的结果却给出一些风景或建筑方面的图像,就说明系统的检索能力和效率还急需提高。(4)视频监视在一些安全监控部门,需要摄像机把周围的环境及其变化记录下来。如果有人在活动,这时更关心目标的人脸的方向和位置,
14、而不是服饰等次要因素,以便辨认和事后检查。这就需要为摄像机提供视野内进行自动跟踪的能力。人脸的检测和跟踪是这类应用的关键部分。(5)媒体压缩的需要为了节约存储空间和传输带宽,应保证人们最为注意和敏感的目标有尽可能小的失真,而对背景进行尽可能大的压缩。多数情况下,人的活动和面部表情成了关注的焦点。这是人脸检测和分割成为研究热点的原团之一。(6)虚拟现实和电子娱乐如果让电子游戏中的角色能感知游戏参与者的头部的动作和面部表情的变化,将大大增强参与者的参与感和真实感。(7)人脸识别由于人脸识别不干扰使用者,不侵犯使用者的隐私,属于非侵犯性的主动识别,易于为用户所接受,而且成本也不高,因此人脸识别成为最
15、有潜力的生物身份验证手段。人脸识别有两种主要的应用:1.身份鉴定(一对多的搜索):在鉴定模式下,确定一个人的身份,识别技术可以快速地计算出实时采集到的人脸数据与人脸数据库中所有己知人员的人脸特征数据之间的相似度,给出一个按相似度递减排列的可能的人员列表,或简单地返回鉴定结果(相似度最高的)和相对应的可信度。身份确认(一对一的比对):即所声明的身份是否与证件上所存的持证人的人脸特征数字编码相符。在确认模式下,人脸特征面纹数据5可以存储在智能卡中或数码记录中,这种应用只需要简单地将实时采集的人脸数据与存储的相比对,如果可信度超过一个指定的阈值,则比对成功,身份得到确认。其应用领域还包括很多方面,比
16、如银行业务、智能卡、访问控制、人机交互界面等等。如果人脸检测作为能适应多种环境图像的技术,精度和效率都有了较大的提高,那么在此基础上再分析人脸的形状等特征,且能消除非相关因素的干扰,结果人脸识别的可靠性和正确率会相应的得到提高。就是说,人脸检测技术的难度和重要意义是不能忽视的。人脸检测的研究受到重视,不仅因为它在基于人脸的身份验证、视觉监视以及丛于内容的检索等方面有着重要的应用,人脸检测研究还具有重要的学术价值。 人脸是一类具有相当复杂的细节变化的自然结构目标,此类目标的检测问题的挑战性在于:(1)人脸由于外貌、表情、肤色等不同,具有模式的可变性;(2)一般意义下的人脸上,可能存在眼镜、胡须等
17、附属物;(3)作为三维物体的人脸的影像不可避免地受由光照产生的阴影的影响。因此,如果能够找到解决这些问题的方法,成功构造出人脸检测与跟踪系统,将为解其它类似的复杂模式检测问题提供重要的启示.目前,国外对人脸检测问题的研究很多,比较著名的有MIT,CMU等;国内的清华大学、北京工业大学、中国科学院计算技术研究所和中国科学院自动化研究所等都有人员从事人脸检测相关的研究.而且,MPEG7标准组织已经建立了人脸识别草案小组,人脸检测算法也是一项征集的内容.随着人脸检测研究的深入,国际上发表的有关论文数量也大幅度增长,重要国际会议上每年都有大量关于人脸检测的论文,占有关人脸研究论文的近1/3之多.有关人
18、脸检测的内容在人脸识别研究的综述中有所涉及,但仅仅侧重于人脸识别系统的输入环节,目前较为详尽的人脸检测与跟踪综述为文献,着重于介绍各种方法所使用的特征和模型。1.2 论文的主要内容人脸由眼睛、鼻子、嘴巴、下巴等器官构成,正因为这些部件的形状、大小和结构上各种差异才使得世界上每个人脸千差万别,因此,对这些器官的形状和结构关系的几何描述,可以作为人脸识别的重要特征。几何特征提取即是用适当的方法对眼睛、鼻子、嘴巴、下巴等器官的形状、大小和结构关系进行几何描述,例如眼睛、鼻子和嘴的位置和宽度,眉毛的厚度和弯曲程度等,以及这些特征器官之间的关系。其中眼睛这一器官有着举足轻重的作用,对眼睛进行几何描述势必
19、先要找到眼睛的位置,即要先进行眼睛定位。而且只要眼睛被精确定位,则脸部其他器官,如眉、鼻、嘴等,可由潜在的分布关系比较准确地定位。在人脸正面图像识别过程,不管是利用人脸的全局特征还是局部特征,是采用图像的几何特征,还是图像的代数特征,人脸方位的变化对识别的结果都有显著的影响,所以在特征提取前必须先对人脸图像进行预处理,如对人脸方位进行调整使其规范化;对人脸图片的拍摄距离进行归一化。在人脸方位调整中对眼睛的准确定位是必不可少的步骤,这是因为两眼中心间距受光照或表情变化的影响最小,双眼中心连线的方向随人像的偏转,可以作为图像旋转的依据。而且若以两眼之间的距离对抽取的各个特征值进行归一化,则这些特征
20、值具有平移、旋转和尺度上的不变性。计算机人脸识别是近年来非常活跃的研究领域。它的应用范围很广,如安全系统中的身份认证、视频监控中目标的识别与跟踪,以及表情分析、年龄分析、唇读、智能计算机中的人机交互等。可以从不同的角度对人脸检测问题进行分类。从人脸姿态的角度,可以分为正面人脸检测、多姿态人脸检测。从人脸个数是否己知的角度,可以分为已知人脸个数的人脸检测、未知人脸个数的人脸检测。从图像背景复杂程度的角度,可以分为简单背景(指无背景或背景的特征被严格约束,在该条件下只利用人脸的轮廓、颜色、运动等少量特征,就能够进行准确检测)、复杂背景(指背景的类型和特征不受约束,某些区域可能在色彩、纹理等特征上与
21、人脸相似,必须利用较多的人脸特征才能做到人脸的准确检测)。从图片是否包含彩色信息的角度,可以分为彩色图片的人脸检测、灰度图片的人脸检测。从图片是否是动态的角度,可以分为在静止图象中检测人脸、在视频图像序列中检测跟踪人脸。人眼作为人脸最显著的特征,与嘴、鼻相比较,能够提供更可靠、更重要的信息,因此往往是人脸识别中必要的处理对象。本文主要讨论在静止灰度单人图像中人眼检测的问题。要进行人眼的识别,首先要进行人脸的识别与定位。人脸识别方法大致有如下几类:一是通过主分量分析法训练和检测人脸,即特征人脸方法。这类方法定位准确,但算法复杂,计算量大。二是通过颜色分析进行肤色检测来定位人脸。此类方法针对彩色图
22、像,利用面部皮肤的颜色特性建立一个新的颜色坐标系,通过从图像中分离出肤色来实现对脸部的定位。此类方法对光照敏感,且无法适用于灰度图像。三是变形模板类方法。该类方法用椭圆近似地表示头部轮廓,通过迭代求精。其缺点是收敛速度慢,运算时间长。另外,还有人使用神经网络方法检测人脸,其缺点同样是计算量太大,无法达到弱实时的要求。有的快速人脸检测方法是灰度投影方法,其中是对图像做水平灰度投影,因为背景及人着装的干扰,给人脸定位造成困难;对彩色图像的红色分量做垂直灰度投影,但直接使用最大和最小梯度值作为界定人脸左右边界的条件,在复杂背景下往往会造成误判。确定人脸之后,再进行人眼的识别。人眼的识别有边缘特征分析
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 图像 特征 定位 学位 论文
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【胜****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【胜****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。