基于图像特征的人眼定位----学位论文.doc

上传人：胜****

文档编号：2589808

上传时间：2024-06-01

格式：DOC

页数：33

大小：756.50KB

下载积分：10 金币

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档保存到电脑，查找使用更方便

10 金币

下载 开通VIP

还剩页未读，继续阅读

举报
申诉本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请申请举报、认领或删除 立即下载

配套讲稿：
如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

特殊限制：
部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。

关键词：
基于图像特征定位学位论文

资源描述：

兰州交通大学毕业设计（论文）内容摘要人脸识别是人类视觉最杰出的能力之一，它的研究涉及模式识别、图像处理、生理，心理学、认知科学，和基于其它生物特征的身份鉴别方法以及计算机人机感知学交互领域都有密切联系其中人眼的识别是计算机人脸识别和智能监控中的重要部分。本文所研究的人眼识别对象都是针对单人正面或半侧面图像。该文提出了一种基于最大类间方差阈值分割和灰度积分投影技术的眼睛定位方法。首先通过图像预处理技术中的中值滤波方法去除图像噪声,并通过非线性变换消除人脸图像因为曝光条件不同而造成的模糊,得到灰度分配较为均匀的图像,然后利用最大类间方差阈值法对图像进行二值化处理,将特征点从人脸图像分割出来,并分别利用水平和垂直灰度积分投影曲线结合人脸的结构特征找到眼睛的位置坐标,实现了准确的眼睛定位,从而为进一步提取其它特征点打好了基础。关键词: 特征提取；眼睛定位；积分投影；阈值分割 Abstract Computer face recognition is a very active area of research in recent years. Its applications range is very wide, such as identity authentication in safety system, video surveillance, target identification and tracking, as well as facial expression analysis, age analysis, lip reading and so on. compared with mouth and nose, Eyes are the most significant features of the face. which can provide more reliable, more important message, so eye detection is often necessary to dispose in face recognition. An algorithm for eyes location is presented in this paper based on maximum variance between two classes and gray- level integration projection. First, median filter is used to eliminate the noise, then the image blur caused by deficient exposal is cleared up using non - linear transform. Maximum variance between two classes is provided to get the binary image, and then the features are extracted from the image. Finally, by the way of gray-levelinte gration projection and human face configuration, we can easily find that the location of eyes is determined by the coordinate of the minimum in the diagram. Further feature detection can be done based on this result. KEYWORDS: Feature extraction; Eye location; Integration projection; Threshold segment 目录目录 3 第一章绪论 4 1.1 课题的背景和意义 4 1.2 论文的主要内容 7 第二章图像预处理基本知识 9 2.1 图像灰度变换 9 2.1.1 图像的灰度化 10 2.1.2 图像灰度求反 11 2.1.3 图像灰度拉伸 12 2.2 图像平滑去噪 13 2.2.1 概述 13 2.2.2 图像噪声分类 13 2.2.3 图像系统噪声的特点 14 2.2.4 均值滤波 15 2.2.5 中值滤波 16 2.3 直方图均衡化 17 2.4 图像二值化 19 第三章人眼定位算法 22 3.1 算法流程 22 3.2 人脸识别的常用方法 24 3.3 投影法原理 24 3.4 人眼左右边界的判定 25 3.5 眉眼区域的判定 26 3.6 眉眼区域的处理 27 3.7 眼睛的精确定位 28 第四章检测结果与分析 29 第五章总结与展望 30 5.1 总结 30 5.2 算法的改进与前景 31 参考文献 32 致谢 33 第一章绪论本章主要介绍了本文的研究背景和研究的意义，以及对本文的研究内容和各个章节的安排进行了介绍。 1.1 课题的背景和意义人脸检测(Face Detection)是指在输入图像中确定所有人脸(如果存在)位置与大小。人脸检测系统的输入是可能包含人脸的图像，输出是关于图像中是否存在人脸以及人脸的数目、位置、尺度、姿态等信息的参数化描述。检测任务的完成涉及从复杂的背景中分割、抽取、验证人脸区域和可能要用到的人脸特征(如眼角、嘴角等)，成功的人脸检测系统应能处理实际存在的光线、人脸方向和离照相机距离变化等各种不同情况。人脸检测作为人脸信息处理中的一项关键技术，近年来成为模式识别与计算机视觉领域内一项受到普遍重视、研究十分活跃的课题。人脸检测问题的提出最早可以追溯到早期的人脸识别研究中对人脸定位的需求。一个完整的人脸自动识别系统至少要包含两个主要的技术环节:人脸的检测和人脸的特征提取与识别。人脸检测是自动人脸识别系统中的一个关键环节，但是早期的人脸识别研究主要针对具有较强约束条件的人脸图像(如无背景人脸图像等)，往往假设人脸位置己知或很容易获得，因此人脸检测问题未引起研究者的充分重视。近几年来，电子商务等网络资源的利用使得人脸识别成为最有潜力的生物身份验证手段，在这种应用背景下，要求人脸自动识别系统能够对一般环境图像具有一定的适应能力，由此所面临的一系列问题使得人脸检测作为一个独立的课题受到研究者的重视。今天，人脸检测的应用背景己经远远超出了人脸识别系统的范畴。随着网络技术和桌上视频的广泛采用，图像捕捉设备正在成为个人计算机的标准外设，为视频会议等服务所急需的技术— 基于内容的压缩与检索成为一个研究热点。人脸的检测是进行人脸压缩的前提条件，同时人脸也是基于内容检索的重要对象,因而人脸检测在这个领域中占有重要的地位。此外，人脸检测在智能化人机界面、视觉监测、数字视频处理等方面也有着重要的应用价值，这使得人脸检测的研究倍受关注。下面对人脸检测的一些应用领域做些简要的介绍: (1) 基于内容的视频检索随着因特网上应用的迅速增长，图像、视频、语音等多媒体信息的使用日益广泛，其数量也迅速膨胀起来。尤其是视频这种媒体，集成了影像、声音和文字，是一种综合媒体。它的非结构化的本质决定了传统的浏览和检索手段不适用于这种媒体。基于内容的多媒体信息检索就是在这样的背景下提出的，并成为多媒体研究领域的一个热点。视频结构单元通常可以看作两层:镜头和场景。镜头是由相互关联的连续的视频组成。它描绘同一个场景，对应摄像机一次记录的起停动作，代表一个场景中时间和空间上连续的动作。在高层的内容分析、索引和分类中，镜头是基本的单元。场景包含有多个镜头，针对同一批对象，但拍摄的角度不同，传达的含义不同。经过分析视频结构单元间的关系建立视频内容语义进而形成有效的视频内容索引，这是支持有效的基于内容的视频检索的关键。显然，只有实现基于语义层次上的检索，结果才能接近用户所要检索内容的要求，所得的结果才能和用户对视频内容的表述一致，比如要检索“有乔丹参加的篮球比赛”的电视节目。而对视频图像中的特定对象(如人或轿车等)的分析是形成语义结果的基础。 (2)有关MPEG-7标准为解决对多媒体信息描述的标准问题，国际运动图像专家组于2001年，发表了国际标准MPEG-7，其全称为“多媒体内容描述接口”，其目标就是制定一组标准的描述子及其描述模式(定义描述子的结构和相互关系)，内容描述与媒体内容结合，使用户能够快速准确地进行检索。它不是针对特定应用的，而是提供了灵活且可扩展的视听内容描述框架以实现各种传输媒体的共享访问和交换、强调基于内容的交互性、可重用性、可伸缩性。除此之外，人的面部表情、性格特征也是NPEG-7的数据类型之一。另外，MPEG-7标准组织已经建立了人脸识别草案小组，人脸检测算法也是一项征集的内容。 (3)基于内容的图像检索现在许多应用都集成了大规模的图像库，而且是其中的重要部分。基于内容的图像检索本质上是基于相似性的检索，最好是利用图像本身的特征，从所有的图像中找出与查询者要求最接近的一批图像。现在可资利用的相似性有全局颜色的相似性，形状的相似性，纹理的相似性等。而基于目标的相似性应该说是很有效的方法。比如，原本要检索一个有关小女孩方面的图像，检索的结果却给出一些风景或建筑方面的图像，就说明系统的检索能力和效率还急需提高。 (4)视频监视在一些安全监控部门，需要摄像机把周围的环境及其变化记录下来。如果有人在活动，这时更关心目标的人脸的方向和位置，而不是服饰等次要因素，以便辨认和事后检查。这就需要为摄像机提供视野内进行自动跟踪的能力。人脸的检测和跟踪是这类应用的关键部分。 (5)媒体压缩的需要为了节约存储空间和传输带宽，应保证人们最为注意和敏感的目标有尽可能小的失真，而对背景进行尽可能大的压缩。多数情况下，人的活动和面部表情成了关注的焦点。这是人脸检测和分割成为研究热点的原团之一。 (6)虚拟现实和电子娱乐如果让电子游戏中的角色能感知游戏参与者的头部的动作和面部表情的变化，将大大增强参与者的参与感和真实感。 (7)人脸识别由于人脸识别不干扰使用者，不侵犯使用者的隐私，属于非侵犯性的主动识别，易于为用户所接受，而且成本也不高，因此人脸识别成为最有潜力的生物身份验证手段。人脸识别有两种主要的应用:1.身份鉴定(一对多的搜索):在鉴定模式下，确定一个人的身份，识别技术可以快速地计算出实时采集到的人脸数据与人脸数据库中所有己知人员的人脸特征数据之间的相似度，给出一个按相似度递减排列的可能的人员列表，或简单地返回鉴定结果(相似度最高的)和相对应的可信度。身份确认(一对一的比对):即所声明的身份是否与证件上所存的持证人的人脸特征数字编码相符。在确认模式下，人脸特征面纹数据[5]可以存储在智能卡中或数码记录中，这种应用只需要简单地将实时采集的人脸数据与存储的相比对，如果可信度超过一个指定的阈值，则比对成功，身份得到确认。其应用领域还包括很多方面，比如银行业务、智能卡、访问控制、人机交互界面等等。如果人脸检测作为能适应多种环境图像的技术，精度和效率都有了较大的提高，那么在此基础上再分析人脸的形状等特征，且能消除非相关因素的干扰，结果人脸识别的可靠性和正确率会相应的得到提高。就是说，人脸检测技术的难度和重要意义是不能忽视的。人脸检测的研究受到重视，不仅因为它在基于人脸的身份验证、视觉监视以及丛于内容的检索等方面有着重要的应用，人脸检测研究还具有重要的学术价值。人脸是一类具有相当复杂的细节变化的自然结构目标,此类目标的检测问题的挑战性在于: (1)人脸由于外貌、表情、肤色等不同,具有模式的可变性; (2)一般意义下的人脸上,可能存在眼镜、胡须等附属物; (3)作为三维物体的人脸的影像不可避免地受由光照产生的阴影的影响。因此,如果能够找到解决这些问题的方法,成功构造出人脸检测与跟踪系统,将为解其它类似的复杂模式检测问题提供重要的启示.目前,国外对人脸检测问题的研究很多,比较著名的有MIT,CMU等;国内的清华大学、北京工业大学、中国科学院计算技术研究所和中国科学院自动化研究所等都有人员从事人脸检测相关的研究.而且,MPEG7标准组织已经建立了人脸识别草案小组,人脸检测算法也是一项征集的内容.随着人脸检测研究的深入,国际上发表的有关论文数量也大幅度增长,重要国际会议上每年都有大量关于人脸检测的论文,占有关人脸研究论文的近1/3之多.有关人脸检测的内容在人脸识别研究的综述中有所涉及,但仅仅侧重于人脸识别系统的输入环节,目前较为详尽的人脸检测与跟踪综述为文献,着重于介绍各种方法所使用的特征和模型。 1.2 论文的主要内容人脸由眼睛、鼻子、嘴巴、下巴等器官构成，正因为这些部件的形状、大小和结构上各种差异才使得世界上每个人脸千差万别，因此，对这些器官的形状和结构关系的几何描述，可以作为人脸识别的重要特征。几何特征提取即是用适当的方法对眼睛、鼻子、嘴巴、下巴等器官的形状、大小和结构关系进行几何描述，例如眼睛、鼻子和嘴的位置和宽度，眉毛的厚度和弯曲程度等，以及这些特征器官之间的关系。其中眼睛这一器官有着举足轻重的作用，对眼睛进行几何描述势必先要找到眼睛的位置，即要先进行眼睛定位。而且只要眼睛被精确定位，则脸部其他器官，如眉、鼻、嘴等，可由潜在的分布关系比较准确地定位。在人脸正面图像识别过程，不管是利用人脸的全局特征还是局部特征，是采用图像的几何特征，还是图像的代数特征，人脸方位的变化对识别的结果都有显著的影响，所以在特征提取前必须先对人脸图像进行预处理，如对人脸方位进行调整使其规范化；对人脸图片的拍摄距离进行归一化。在人脸方位调整中对眼睛的准确定位是必不可少的步骤，这是因为两眼中心间距受光照或表情变化的影响最小，双眼中心连线的方向随人像的偏转，可以作为图像旋转的依据。而且若以两眼之间的距离对抽取的各个特征值进行归一化，则这些特征值具有平移、旋转和尺度上的不变性。计算机人脸识别是近年来非常活跃的研究领域。它的应用范围很广,如安全系统中的身份认证、视频监控中目标的识别与跟踪,以及表情分析、年龄分析、唇读、智能计算机中的人机交互等。可以从不同的角度对人脸检测问题进行分类。从人脸姿态的角度，可以分为正面人脸检测、多姿态人脸检测。从人脸个数是否己知的角度，可以分为已知人脸个数的人脸检测、未知人脸个数的人脸检测。从图像背景复杂程度的角度，可以分为简单背景(指无背景或背景的特征被严格约束，在该条件下只利用人脸的轮廓、颜色、运动等少量特征，就能够进行准确检测)、复杂背景(指背景的类型和特征不受约束，某些区域可能在色彩、纹理等特征上与人脸相似，必须利用较多的人脸特征才能做到人脸的准确检测)。从图片是否包含彩色信息的角度，可以分为彩色图片的人脸检测、灰度图片的人脸检测。从图片是否是动态的角度，可以分为在静止图象中检测人脸、在视频图像序列中检测跟踪人脸。人眼作为人脸最显著的特征,与嘴、鼻相比较,能够提供更可靠、更重要的信息,因此往往是人脸识别中必要的处理对象。本文主要讨论在静止灰度单人图像中人眼检测的问题。要进行人眼的识别,首先要进行人脸的识别与定位。人脸识别方法大致有如下几类:一是通过主分量分析法训练和检测人脸,即特征人脸方法。这类方法定位准确,但算法复杂,计算量大。二是通过颜色分析进行肤色检测来定位人脸。此类方法针对彩色图像,利用面部皮肤的颜色特性建立一个新的颜色坐标系,通过从图像中分离出肤色来实现对脸部的定位。此类方法对光照敏感,且无法适用于灰度图像。三是变形模板类方法。该类方法用椭圆近似地表示头部轮廓,通过迭代求精。其缺点是收敛速度慢,运算时间长。另外,还有人使用神经网络方法检测人脸,其缺点同样是计算量太大,无法达到弱实时的要求。有的快速人脸检测方法是灰度投影方法,其中是对图像做水平灰度投影,因为背景及人着装的干扰,给人脸定位造成困难;对彩色图像的红色分量做垂直灰度投影,但直接使用最大和最小梯度值作为界定人脸左右边界的条件,在复杂背景下往往会造成误判。确定人脸之后,再进行人眼的识别。人眼的识别有边缘特征分析法、Hough变换法和变形模板法等。变形模板法能够准确地确定人眼形状及大小,但存在收敛速度的题;Hough变换法检测瞳孔的圆形特征或眼睑形成的椭圆特征,所需计算量大。本文所采用的方法是一种新的人眼定位方法。使用中值滤波和直方图均衡方法去除噪声和光照对图像的影响后,将图像做积分投影以缩小到人脸的眼部区域,在得到的眉眼区域中再做一次水平积分投影,找到两眼的垂直位置。最后利用人眼模板沿着该垂直方向进行匹配程度最高的部分即为要定位的人眼位置。第二章图像预处理基本知识本章主要介绍了数字图像处理的相关知识，为下一章进行人眼检测算法提供了理论基础。 2.1 图像灰度变换当图像受到CCD 摄像系统的影响，受到摄像机周围环境的影响，受到成像时曝光不足或过度的影响，以及受到成像设备的非线性，或图像记录设备动态范围太窄的影响，都会出现对比度不足，使图像中的细节分辨不清。另外，自然图像由于其灰度通常分布在较窄的区间，也会引起图像细节不清楚。对CCD 摄像系统获取的图像，进行直方图变换，可使图像的灰度间距拉开或者使图像的灰度分布图像的灰度变换处理是图像增强处理技术中一种非常基础、直接的空间域图像处理方法，也是图像数字化软件和图像显示软件的一个重要组成部分。灰度变换是指根据某种目标条件按一定变换关系逐点改变原图像中每一个像素灰度值的方法。目的是为了改善画质，使图像的显示效果更加清晰。灰度变换有时又被称为图像的对比度增强或对比度拉伸。从图像输入装置得到的图像数据，以浓淡表示，每个像素与某一灰度值相对应。设原图像的灰度值，处理后图像像素的灰度值,则灰度增强可表示为：（2.1）或要求和D' 都在图像的灰度范围之内。函数T(D) 称为灰度变换函数，它描述了输入灰度值和输出灰度值之间的转换关系。一旦灰度变换函数确定，则确定了一个具体的灰度增强方法。图像中每一点的运算就被完全确定下来。灰度变换函数不同，即使是同一图像也会得到不同的结果。选择灰度变换函数应该根据图像的性质和处理目的来决定。选择的标准是:经过灰度变换后，像素动态范围增加，图像的对比度扩展，使图像变得更加清晰、细腻，容易识别。灰度变换主要针对独立的像素点进行处理，通过改变原始图像数据所占据的灰度范围而使图像在视觉上得到良好的改观，没有利用像素点之间的相互空间关系。因此，灰度变换处理方法也叫做点运算法。点运算是一种既简单又重要的技术，一幅输入图像经过点运算后将产生一幅新的输出图像，由输入像素点的灰度值决定相应的输出像素点的灰度值。点运算与局部运算的差别在于：后者每个输出像素的灰度值，由对应输入像素的一个临域内几个像素的灰度值决定。因此，点运算不可能改变图像内的像素的空间关系。 2.1.1 图像的灰度化图像灰度化就是使彩色的分量值相等的过程. 由于的取值范围是0～255 ,所以灰度的级别只有256 级,即灰度图像仅能表现256 种颜色(灰度)。灰度化处理的方法主要有三种: 1 ) 最大值法:使的值等于三值中最大的一个,即: （2.2）最大值法会形成亮度很高的灰度图像。 2 ) 平均值法:使的值求出平均值,即: （2.3）平均值法会形成较柔和的灰度图像。 3 ) 加权平均值法:根据重要性或其他指标给赋予不同的权值,并使R 、G、B 它们的值加权平均,即: （2.4）其中分别为的权值. 取不同的值,加权平均值法就将形成不同的灰度图像.由于人眼对绿色的敏感度最高,对红色的敏感度次之,对蓝色的敏感度最低,因此使将得到较合理的灰度图像。试验和理论推导证明,当时,即当（2.5）（2.6）时,能得到最合理的灰度图像。用MATLAB实现程序如下： I=imread('F:\01.JPG'); figure(1),imshow(I); I=rgb2gray(I); figure(2),imshow(I) (a) 原始图像 (b) 灰度化图像图2.1 彩色图像的灰度化 2.1.2 图像灰度求反对图像求反是将原图灰度值翻转，简单说来就是使黑变白，使白变黑。当被显示图像在低灰度区间呈现高度非线性时，此变换能使原图像低灰度区间的细节转换到高灰度区间。即假设对灰度范围是的图像求反，就是通过变换将变换到，变换公式如下：（2.7） (a)原始图像 (b)求反处理的结果图图2.2 图像灰度求反结果图用MATLAB实现程序如下： I=imread('F:\01.JPG'); figure(1),imshow(I); I=rgb2gray(I); figure(2),imshow(I) I=double(I); I=256-1-I; figure,imshow(uint(I)); 2.1.3 图像灰度拉伸一般，图像看不清楚，多数是由于图像相邻像元的灰度级太接近，称为灰度压缩，即相互之间灰度差远小于人的视觉对灰度分辨能力的限制。这种图像视觉效果差，人会感觉模糊。我们可以用映射的方法，把原来压缩的直方图分开一些，也就是灰度拉伸，得到的图像自然会清晰的多。 (a)原始图像 (b) 灰度拉伸结果图2.3 图像灰度拉伸结果图用MATLAB实现程序如下： I=imread('F:\01.JPG'); figure,imshow(I); I=rgb2gray(I); figure,imshow(I); I=double(I); [m,n]=size(I); for i=1:m for j=1:n if I(i,j)<=30 I(i,j)=I(i,j); elseif I(i,j)<=150 I(i,j)=(200-30)/(150-30)*(I(i,j)-30)+30; else I(i,j)=(255-200)/(255-150)*(I(i,j)-150)+200; end end end figure,imshow(uint8(I)); 2.2 图像平滑去噪图像在生成和传输过程中常受到各种噪声的干扰和影响，使图像质量下降。为了达到系统的要求，就要抑制噪声，改善图像质量，也就是对图像进行平滑去噪处理。对于滤除图像中的噪声，人们已经提出了很多的方法。通常，将数字图像的平滑技术划分为两类。一类是全局处理，即对噪声图像的整体或大的块进行校正以得到平滑的图像。例如在变换域中使用wiener 滤波、最小二乘法滤波等。使用这些技术需要知道信号和噪声的统计模型。但对大多数图像而言，人们不知道或不可能用简单的随机过程精确地描述统计模型，而且，这些技术的计算量也相当大。另一类平滑技术是对噪声图像使用局部算子。当对某一像素进行平滑处理时，仅对它的局部小邻域的一些像素加以运算，其优点是计算效率高，而且可以多个像素并行处理。因此可实现实时或者准实时处理。 2.2.1 概述一般，噪声是不可预测的随机信号，通常是通过概率统计的方法对其进行分析，噪声对图像处理十分重要，它影响图像处理的输入，采集，处理的各个环节以及输出结果的全过程，特别是图像的输入，采集噪声的抑制是十分关键的问题，若输入伴有较大的噪声，必然影响处理全过程及输出的结果，因此，一个良好的图像处理系统，不论是模拟处理还是用计算机进行的数字处理，并不把减少最前一级的噪声作为主攻目标。 2.2.2 图像噪声分类根据噪声产生的来源，大致可以分为外部噪声和内部噪声两大类。外部噪声指从处理系统外来的影响，如天线干扰或电磁波从电源线窜入系统的噪声。内部噪声则有以下四种最常见的形式。（1）由光和电的基本性质引起的噪声，例如电流可看作电子或空穴运动，这些粒子运动产生随机散粒噪声，导体中电子流动的热噪声，光量子运动的光量子。（2）有机械运动引起的噪声，例如，接头振动使电流不稳，磁头或磁带，磁盘抖动等。（3）元器件的噪声，如光学底片的颗粒噪声，磁带，磁盘缺陷噪声，光盘点噪声等。（4）系统内部电路噪声。从噪声的分类方法来看是多种多样的，但综合来说，噪声是随机产生的量，所以又可以从统计数学的观点来定义噪声。凡是统计特性不随时间变化的噪声称为平稳噪声，而统计特性随时间变化的噪声称为非平稳噪声。 2.2.3 图像系统噪声的特点对灰度图像来说，可看作是二维亮度分析，则噪声可看作是对亮度的干扰，用来表示。噪声是随机性的，因而需用随机过程来描述，即要求知道其分布函数或密度函数。但在许多情况下着些函数很难测出或描述，甚至不可能看到，所以常用统计特征来描述噪声，如均值，方差，总功率等。设为理想图像，为噪声，实际输出图像为。对于加性噪声而言，其特点是和图像光强大小无关。即有 =+ (2.8) 对于乘性噪声而言，其特点是和图像光强度相关，随亮度的大小变化而变化。即有 =[1+]=+ (2.9) 乘性噪声模型和它的分析计算都比较复杂。通常总是假定信号和噪声互相独立的，通常对数变换后当作加性噪声的模型来处理。按噪声对图像的影 2.2.4 均值滤波均值滤波的方法是对待处理的当前像素选择一个模板，该模板为其近邻的若干像素组成，用模板中的像素的均值代替原像素值的方法。考虑到数据分析的平衡性，模板一般选择为3×3，5×5，待处理像素放在模板的中心，为了使输出像素值保持在原来的灰度值范围之内，模板的饿权值总和应维持为1，因此模板与模板像素的乘积要处以一个系数，通常是模板系数之和，这个过程被称为归一化。均值滤波处理之后，噪声部分被弱化到周围像素点上，所以得到的结果是噪声值减少，但是总的颗粒面积变大。另外，均值滤波有一个非常致命的缺点，就是在求均值的计算中，会同时将景物的边缘点同时进行均值处理，这样就使景物的清晰度降低，画面变得模糊。设为给定的含有噪声的图像，经过简单领域平均处理为，在数学上可表现为：其中 (2.10) 式中是所取邻域中的各邻近像素的坐标，是领域中包含的邻近像素的个数。可以这样说明，在上按行（或列）对每个像素选取一定尺寸的邻域，并用邻域中邻近像素的平均灰度来置换这一像素值，对全部像素处理后可获得。对于邻域可以有不同的选取方式。为了保持平滑处理后的图像的平均值不变，模板内各元素之和为1。有时，为了突出原点本身的重要性，以便尽量抑制图像中的模糊效应，在模板中心和较近的元素，可以赋以大的加权值。用MATLAB实现程序如下： I=imread('F:\01.JPG'); figure(1),imshow(I); I=rgb2gray(I); figure(2),imshow(I) K=filter2(fspecial('average',3),I); figure,imshow(uint8(K)); (a) 原始图像 (b) 均值滤波图像图2.4 均值滤波处理结果可见，均值滤波处理时是以图像模糊为代价来换取噪声的减小的，且面积（即模板大小）越大，噪声减少越明显。如果处理点是噪声点，其邻近像素灰度与之相差很大，一旦用简单邻域平均法，即邻近像素的平均值来置换它，能明显地将噪声点压制下去，使邻域中灰度接近均匀，起到平滑灰度的作用。因此，领域平均法具有显著地平滑噪声的效果，邻域平均法是一种有效的平滑技术。 2.2.5 中值滤波中值滤波法也是一种局部平均平滑技术。它对脉冲干扰和椒盐噪声的抑制效果较好，在抑制随机噪声的同时能使边缘减少模糊。中值滤波法是一种非线性的图像平滑方法，它对一个滑动窗口内的诸像素灰度排序，用其中值代替窗口中心像素原来的灰度（若窗口中有偶数个像素，则取两个中间值的平均）。（a）原始图像（b）中值滤波图2.5 中值滤波处理结果用MATLAB实现程序如下： I=imread('F:/01.JPG');figure(1); imshow(I); J=rgb2gray(I); figure(2)，imshow(J); K=medfilt2(J,[3 3]); 应用中值滤波，就能很好地保持原来边界。所以说，中值滤波的特点是保护图像边缘的同时去除噪声。另外，中值滤波对脉冲噪声也非常有效。虽然，中值滤波容易去除孤立点、线性的噪声，同时保持图像的边缘，并能很好地去除二值噪声，但对高斯噪声无能为力。要注意的是，当窗口内噪声点的个数大于窗口宽度一半时，中值滤波的效果不好。因此，正确选择窗口尺寸的大小是用好中值滤波的重要环节。一般很难事先确定最佳的窗口尺寸，需要通过从小窗口到大窗口的试验，再从中选取最好的结果。 2.3 直方图均衡化在信息论中有这样一个结论，当数据的分布接近均匀分布的时候，数据所承载的信息量为最大，图像的灰度直方图表示数字图像中每一个灰度与其出现频度间的统计关系。直方图能给出该图像的概貌性描述，例如图像的灰度范围、每个灰度级的频度和灰度的分布、整幅图像的平均明暗和对比度等，由此可得出进一步处理的重要依据。自然图像由于其灰度通常分布在较窄的区间，引起图像细节不清楚。采用直方图修整后可使图像的灰度间距拉开或者使灰度分布均匀，从而增大反差，使图像细节清晰，达到图像增强的目的。另外 ,因为曝光条件的不同 ,图像灰度可能会局限在一个很小的范围内 ,造成图像的模糊不清。现采用直方图均衡的方法来进行处理,图像的低灰度区域有了较大扩展 ,而高灰度区域得到了压缩。直观的看，直方图均衡化将导致信号值所占区域的对比度增加。要进行直方图均衡化均衡化图像的直方图只是近似均匀的直方图分布。均衡化后的图像动态范围扩大了，但其本质是扩大了量化层间隔，而非量化层的数目，相反，均衡化后级数分布减少，因而可能会出现伪轮廓。设分别为原图像和处理后的图像，图像的灰度化范围为[0，255]，则直方图均衡化方法具体步骤如下：（1）求原图的灰度直方图，设用256维的向量表示；（2）由求原图的灰度分布概率，记作，则有（2.11）其中，分别为图像的长和宽）为图像的总像素个数；（3）计算图像各个灰度值的累计分布概率，记作，则有（2.12）其中，令。（4）进行直方图均衡化计算，的到处理后图像的像素值为：（2.13）（a）中值滤波后图像（b）灰度均衡化结果图（c）原始图像直方图（d）直方图均衡化直方图图2.5 图像均衡化结果图用MATLAB实现程序如下： I=imread('F:/01.JPG');figure(1); imshow(I); J=rgb2gray(I); figure(2); imshow(J); K=medfilt2(J,[3 3]); H=histeq (K); figure(3); imshow (H); figure(4),imhist(K); figure(5),imhist(H); 直方图均衡化的方法是直方图修整法的一个特例，即直方图均衡化的优点是能自动的增强整个图像的对比度，但它的具体增强效果不易控制，处理的结果总是得到全局均衡化的直方图。实际中有时需要变换直方图使之成为某个特定的形状，从而有选择地增强某个灰度值范围的对比度。从画面的效果来看，可以非常逼真的再观灯光的效果，图像画面的参差敢加强，细节也比较清晰，从直方图可知，基本上均匀占据了整个图像灰度值允许的范围，并且直方图的大致轮廓与直方图相似，这就表示了处理后的图像不仅表现效果得到改善，并且使原始图像的特征在处理后的图像中得到了保持。 2.4 图像二值化要将特征点从人脸图像分割出来,二值化阈值的选取是关键,为此,国内外学者进行了广泛深入的研究和大量实验,提出了多种阈值选取方法, 如双峰直方图阈值分割法、最大熵阈值分割法、模糊聚类分析法等。这里采用的是最大类间方差阈值分割法,又叫大津法。其基本思路是将直方图在某一阈值处分割成两组, 当被分成的两组的方差为最大时,决定阈值。设一幅图像的灰度值为级,灰度值为的象素数为,此时得到总像素数: (2.14) 各值的概率为: (2.15) 然后将像素用k将其分成两组和,则各组的概率为: 的概率: (2.16) 的概率: (2.17) 的平均值: (2.18) 的平均值: (2.19) 其中: 是图像的整体灰度平均值, 是阈值为时灰度的平均值,定义、两组间的方差如(3.8) 式所示: (2.20) 寻找间使得上式取最大值的,即可得到阈值。用MATLAB实现程序如下： I=imread('F:/01.JPG');figure(1); imshow(I); J=rgb2gray(I); figure(2); imshow(J); K=medfilt2(J,[3 3]); H=histeq (K); fig

展开阅读全文

咨信网温馨提示：
1、咨信平台为文档C2C交易模式，即用户上传的文档直接被用户下载，收益归上传人（含作者）所有；本站仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿，我们不确定上传用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的版权、权益或隐私，请联系我们，核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据，个别因单元格分列造成显示页码不一将协商解决，平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺，下载前须认真查看，确认无误后再购买，务必慎重购买；若有违法违纪将进行移交司法处理，若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传，付费前请自行鉴别，如您付费，意味着您已接受本站规则且自行承担风险，本站不进行额外附加服务，虚拟产品一经售出概不退款（未进行购买下载可退充值款），文档一经付费（服务费）、不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印，是因预览和防盗链等技术需要对页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有水印标识（原文档上传前个别存留的除外），下载后原文更清晰；试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓；PPT和DOC文档可被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；PDF文档不管是原文档转换或图片扫描而得，本站不作要求视为允许，下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用；网站提供的党政主题相关内容(国旗、国徽、党徽－－等)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
6、文档遇到问题，请及时联系平台进行协调解决，联系【微信客服】、【QQ客服】，若有其他问题请点击或扫码反馈【服务填表】；文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“【版权申诉】”，意见反馈和侵权处理邮箱：1219186828@qq.com；也可以拔打客服电话：0574-28810668；投诉电话：18658249818。

关于本文

本文标题：基于图像特征的人眼定位----学位论文.doc
链接地址：https://www.zixin.com.cn/doc/2589808.html

胜****

内容提供者实名认证

平台协调中心【客服】

相似文档自信AI助手

毕业设计方案栲胶法脱硫.doc
解决代孕的法律问题初探-法学学士毕业论文.doc
母线加工及装配工艺守则模板.doc
毕业设计方案红酒杯在数控车床上的基本工艺设计编程和加工过程.doc
小区智能化系统项目可行性报告.doc
水泥搅拌桩专项综合项目施工专项方案.docx
水泥土综合标准施工专业方案.doc
水果市场调查研究报告.doc
毕业设计方案汽车悬架设计.doc

搜索标签自信AI导航

基于图像特征定位学位论文