本科毕业论文---基于神经网络的数字识别系统的设计正文.doc
《本科毕业论文---基于神经网络的数字识别系统的设计正文.doc》由会员分享,可在线阅读,更多相关《本科毕业论文---基于神经网络的数字识别系统的设计正文.doc(52页珍藏版)》请在咨信网上搜索。
毕业设计(论文)任务书 题目:基于神经网络的数字识别系统的设计 系 名 信息工程系 专 业 自动化 年 级 2009级 学生姓名 许凯钥 学 号 6009206039 指导教师 扈书亮 职 称 讲 师 2012年 12 月 15 日 一、原始依据(包括设计或论文的工作基础、研究条件、应用环境、工作目的等。) 工作基础:了解C++的基本概念和语法,熟练使用Visual C++软件。 研究条件:依据BP神经网络的基本原理完成算法实现。 应用环境:基于BP神经网络的图像文件中的数字识别。 工作目的:熟练掌握Visual C++应用程序的开发。 了解人工智能的基本概念以及神经网络的基本原理。 熟练掌握Visual C++中的图片处理的基本方法。 二、参考文献 [1]人工智能原理及其应用,王万森,电子工业出版社,2007. [2] VC++深入详解,孙鑫,电子工业出版社,2006. [3]人工神经网络原理, 马锐,机械工业出版社,2010. [4] Visual C++数字图像处理典型案例详解,沈晶,机械工业出版社,2012. [5]Application of Image Processing to the Characterization of Nanostructures,Manuel F. M. Costa,Reviews on Advanced Materials Science,2004. 三、设计(研究)内容和要求(包括设计或研究内容、主要指标与技术参数,并根据课题性质对学生提出具体要求。) 1、掌握C++的基本概念和语法。 2、了解神经网络的基本原理。 3、完成Visual C++中对于图像的预处理。 4、完成基于样本的神经网络的训练以及图像中文字的识别,并对其性能进行统计和总结。 指导教师(签字) 年 月 日 审题小组组长(签字) 年 月 日 天津大学仁爱学院本科生毕业设计(论文)开题报告 课题名称 基于神经网络的数字识别系统的设计 系 名 称 信息工程系 专业名称 自动化 学生姓名 许凯钥 指导教师 扈书亮 一、 课题来源及意义 多层感知器神经网络BP(Back Propagation)网络是1986年由Rumelhart和McClelland为首的科学家提出,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。BP网络能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。它的学习规则是使用最速下降法,通过反向传播不断调整网络的权值和阈值,使网络的误差平方和最小。 由于人工神经网络等新技术的引进,从上世纪70年代以来,光学字符识别技术逐渐走向成熟。进入九十年代以来,人工神经网络技术发展十分迅速,它具有模拟人类部分形象思维的能力,是一种模仿人脑学习、记忆、推理等认知功能的新方法。特别是它的信息并行分布式处理能力和自学习功能等显著优点,更是激起了人们对它的极大的兴趣。为模式识别开辟了新的途径,成了模拟人工智能的一种重要方法。 近年来,字符识别技术在维持国民经济迅速发展的多个领域中占据着非常重要的地位。目前,小规模光学字符识别系统应用广泛,有着巨大地商业前景,如邮政编码识别、汽车招牌识别、产品编码识别等。因此,对于研究基于神经网络的文字识别系统有重要的意义。 二、研究目标 1.熟练掌握Visual C++应用程序的开发 2.了解人工智能的基本概念以及神经网络的基本原理。 3.熟练掌握Visual C++中的图片处理的基本方法。 三、 研究内容 系统识别框架图 基于BP网络的文字识别系统分为两个阶段,学习阶段与识别阶段。两个阶段都要对样本字母进行预处理、特征提取,学习阶段还要进行确定稳定的权值,识别阶段还要经过分类在输出识别结果。 数字图像在采集过程中,受到像素质量、扫描性能的影响,数字图像会带有形变和噪声,这些变化都会影响识别效果。因此要进行预处理,目的是消除原始图像中的噪声,将原来的图像转化为清晰地二值化图像,便于微观结构特征的提取。预处理过程包括去噪、二值化、归一化和细化。 特征提取是使用计算机提取图像信息,来决定每个图像的点是否属于一个图像特征。在字符识别当中,特征的选择是一个关键的问题。字符的特征可以分为两大特征:结构特征和统计特征。特征提取的原则是所选用的特征能够很好地反映字符本身的特点。 训练模式是用样本字符进行识别,将识别效果与样本进行比对,判断是否存在误差。多次训练,直至误差满足在一定范围内即可。 学习阶段完成进入识别阶段,识别阶段同样进行预处理与特征提取两个环节,与学习阶段不同的是它还要进行分类才能输出结果。 四、研究方法与手段 完成Visual C++中对于图像的预处理及基于样本的神经网络的训练以及图像中文字的识别,并对其性能进行统计和总结。对于图像的预处理、基于样本的神经网络的训练以及图像中文字的识别通过Visual C++软件编程实现。 特征提取是使用计算机提取图像信息,来决定每个图像的点是否属于一个图像特征。在字符识别当中,特征的选择是一个关键的问题。字符的特征可以分为两大特征:结构特征和统计特征。特征提取的原则是所选用的特征能够很好地反映字符本身的特点。 五、进度安排 1、2012.12.10—2013.03.05 查找资料,通过书籍和视频学习C++ 的基本概念和语法,初步练习使用 Visual C++软件。了解BP神经网络的 基本原理及人工智能的基本概念。完 成开题报告。 2、2013.03.06—2013.03.29 掌握Visual C++中的图片处理的基本 方法。 3、2013.03.30—2013.04.20 编写程序,完成Visual C++中对于图 像的预处理。 4、2013.04.21—2013.05.25 完成基于样本的神经网络的训练以及 图像中文字的识别,并对其性能进行 统计和总结。 5、2013.05.26—2013.06.10 撰写论文,准备答辩。 六、主要参考文献 [1] 王万森. 人工智能原理及其应用[M]. 电子工业出版社, 2007. [2] 孙鑫. VC++深入详解[M]. 电子工业出版社, 2006. [3] 马锐. 人工神经网络原理[M]. 机械工业出版社, 2010. [4] 沈晶. Visual C++数字图像处理典型案例详解[M]. 机械工业出版社, 2012. [5] 曾志军, 孙国强. 基于改进的BP 网络数字字符识别[J].上课理工大学学报, 2008, 32(1)51-53. . [6] 周鸣争. 人工神经网络在自动控制系统中的应用[J]. 安徽机电学院学报, 2000,02(5)71-75. [7] 张世辉, 孔令富. 汉字识别及现状分析[J]. 燕山大学学报, 2003,04(3)80-85.. [8] 李连胜. 基于神经网络的手写数字识别技术研究[D]. 中南大学, 2008. [9] 赵蓉. 基于神经网络的联机手写识别系统研究与实现[D]. 西安电子科技大学, 2011. [10] 赵辉, 叶子青. Visual C++系统开发实例精粹[M]. 人民邮电出版社. [11] 黄襄念, 程萍著. 文字识别原理与策略[M]. 第一版. 西南交通大学出版社, 2002. [12] 韩力群. 人工神经网络理论、设计及应用[M]. 第二版. 化学工业出版社, 2007. [13] 韩力群. 人工神经网络教程[M]. 北京邮电大学出版社, 2006. [14]Application of Image Processing to the Characterization of Nanostructures,Manuel F. M. Costa,Reviews on Advanced Materials Science. [15] Bartlett P L. Ada Boost is Consistent [M]. Department of statics and computer science of California. 选题是否合适: 是□ 否□ 课题能否实现: 能□ 不能□ 指导教师(签字) 年 月 日 选题是否合适: 是□ 否□ 课题能否实现: 能□ 不能□ 审题小组组长(签字) 年 月 日 毕业设计(论文)说明书 题目:基于神经网络的数字识别系统的设计 系 名 信息工程系 专 业 自动化 年 级 2009级 姓 名 许凯钥 指导教师 扈书亮 2013年6月 6日 摘 要 目前,小规模光学字符识别系统应用广泛,有着巨大的应用前景,如邮政编码识别、汽车招牌识别、产品编码识别等。本课题综合分析了国内外文字识别技术的发展现状,利用BP神经网络设计并实现一种高效可靠的字符识别系统。 本设计主要完成了如何利用BP神经网络去识别图片上的字符。在识别之前要对图像进行一系列的预处理,主要包含灰度化、二值化、锐化、噪声去除、字符分割、字符归一化、字符骨架提取等。经过预处理的图片适合后续的训练及识别。预处理后对图片上的字符进行特征提取,特征提取的方法很多,这里选择效果较好的十三特征提取法来进行特征提取。最后采用BP神经网络来对待检测的图片上的数字进行识别。 关键词:字符识别;BP网络;人工神经网络;预处理;特征提取 ABSTRACT Currently, small-scale optical character recognition system is widely used, and it has great prospects in application, such as zip code recognition, auto signature identification, product code recognition, and so on. This papper analyzes the development status of recognition technology at home and abroad comprehensively, by using BP neural network can we design and implement an efficient and reliable character recognition system. This design can realize the recognition of characters on the picture by using BP neural network. Before identification, there are a series of image pretreatment which are graying, binarization, sharpening, noise removal, character segmentation, character normalization and character skeleton extraction. Images which are pretreated will be more suitable for the later training and recognition. After pretreatment, feature extraction is performed. There are a lot of ways of feature extraction, the extraction method of thirteen features which has better evaluation was chosen here. Finally, it uses BP neural network to identify the numbers on the pictures which are to be tested. Keywords: Character Recognition; Pretreatment; BP Neural Network; Artificial Neural Network;Feature Extraction 目 录 第一章 绪论 1 1.1 文字识别的简介 1 1.2 文字识别方法及研究现状 1 1.3 课题研究内容 2 第二章 人工神经网络 3 2.1 人工神经网络 3 2.2 DELTA学习规则 6 2.3 BP网络 7 第三章 图像的预处理 13 3.1 256色位图灰度化 13 3.2 灰度图像二值化 14 3.3 图像的梯度锐化 15 3.4 去除离散的杂点噪声 15 3.5 整体倾斜度调整 16 3.6 字符分割 17 3.7 标准归一化 19 3.8 紧缩的紧缩重排 20 3.9 特征提取 20 第四章 基于人工神经网络的数字识别 22 4.1 系统框架 22 4.2 基于神经网络的数字识别的基本过程 22 4.3 程序的运行 27 第五章 总结与展望 29 5.1 总结 29 5.2 后续工作及展望 29 参考文献 外文资料 中文译文 致 谢 天津大学仁爱学院2013届本科生毕业设计(论文) 第一章 绪论 1.1 文字识别的简介 利用计算机自动识别字符的技术,是模式识别应用的一个重要领域。人们在生产和生活中,要处理大量的文本。为了减轻人们的劳动负担,提高处理的效率,50年代开始探讨一般文字识别方法,并研制出了光学字符识别器。60年代出现了采用磁性墨水和特殊字体的实用机器。60年代后期,出现了多种字体和手写体文字识别机器,它的识别精度和机器性能都基本上能满足人们日常生活的要求。70年代主要研究文字识别的基本理论和研制高性能的文字识别机,并着重于汉字识别的研究。 文字识别一般包括文字信息的采集、信息的分析预处理、信息的分类判别等几个部分。 信息采集 将纸面上的文字灰度变换成电信号,输入到计算机中去。信息采集由文字识别机中的送纸机构和光电变换装置来实现,有飞点扫描、摄像机、光敏元件和激光扫描等光电变换装置。 信息分析和处理 对变换后的电信号消除各种由于印刷质量、纸质(均匀性、污点等)或书写工具等因素所造成的噪音和干扰,进行大小、偏转、浓淡、粗细等各种正规化处理。 信息的分类判别 对去掉噪声并正规化后的文字信息进行分类判别,以输出识别结果。 1.2 字识别方法及研究现状 1.2.1 文字识别方法 文字识别方法 文字识别方法基本上分为统计、逻辑判断和句法三大类。常用的方法有模板匹配法和几何特征抽取法。 ① 模板匹配法 将输入的文字与给定的各类别标准文字进行相关匹配,计算输入文字与各模板之间的相似性程度,取相似度最大的类别作为识别的结果。这种方法的缺点是当被识别类别数目增加时,标准文字模板数量也随之增加。这一方面会增加机器的存储容量,另一方面也会降低识别的正确率,所以这种方式适用于识别固定字型的印刷体文字。这种方法的优点是用整个文字进行相似度计算,所以对于文字缺损、边缘噪声等具有较强的适应能力。 ② 几何特征抽取法 抽取文字的一些几何特征,如文字的端点、分叉点、凹凸部分或水平、垂直、倾斜等各方向的线段、闭合环路等,根据这些特征的位置及相互关系进行逻辑组合判断,获得识别结果。这种识别方式由于利用了结构的信息,因此也适用于手写体文字那样变型较大的字符。 1.2.2 文字识别发展现状 文字识别可应用于许多领域,如阅读、文献资料的检索、信件的分拣、稿件的校对、银行支票的处理、商品发票的统计汇总、商品编码的识别等。它可以方便用户快速录入信息,提高各行各业的工作效率。 随着我国信息化建设的全面开展,文字识别技术诞生20余年来,经历从实验室技术到产品的转变,目前已经步入行业应用开发的成熟阶段。相比发达国家的广泛应用情况,在国内,文字识别技术在各领域的应用还有着广阔的前景。随着国家信息化建设的发展,文字识别技术拥有了一个全新的行业应用局面。 1.3 课题研究内容 本课题研究内容如下: 1.BP神经网络是人工神经网络的其中一种,它利用实际输出与期望输出之差对网络的各层连接权由后向前前逐层进行校正。通过学习BP网络的算法,对BP网络进行反复训练,确定稳定的权值与阈值,进而应用到文字识别系统中去。 2.对待识别图片进行一系列预处理。预处理的过程主要包括图像的灰度化、二值化、图像的调整、离散噪点的去处、字符的切分、图像的缩放、字符的细化、字符的平滑等。 3.识别过程分为三个阶段:预处理阶段,BP网络的训练阶段,字符识别阶段。设计程序分别完成三个阶段,利用BP神经网络识别图片中的数字信息。 第二章 人工神经网络 2.1 人工神经网络 人工神经网络(Artificial Neural Network, ANN)也称为神经网络(Neural Networks,NN),即从生物学神经系统的信号传递而抽象发展成的一门学科。在神经网络中,最基本的单元就是神经元。 2.1.1 人工神经元 神经元由三部分组成:树突、细胞体和轴突。树突是树状神经纤维接受网络,它将电信号传递给细胞体,细胞体对这些输入信号进行整合并且进行阈值处理。轴突是单根长纤维,它把细胞体的输入信号导向其他的神经元。神经元的排列拓扑结构和突触的连接强度确立了神经网络的功能。形象的说,神经网络是由大量处理单元广泛连接而成的网络,是对人脑的抽象、简化和模拟,反映人脑的基本特性。它能够通过学习过程从外部环境中获取知识,并且它的内部很多神经元可以用来存储已经学到的知识。人工神经元模型是生物神经元的抽象。图2-1为一种典型的人工神经元模型。 图2-1 人工神经元模型 人工神经元相当于一个多输入单输出的非线性阈值器件。这里的表示的为它的n个输入;表示与它相连的n个突触的连接强度,其值成为权值;称为激活值,表示这个人工神经元的输入总和,对应于生物神经细胞的膜电位;表示这个人工神经元的输出;表示这个人工神经元的阈值。如果输入信号的加权和超过,则人工神经元被激活。这样,人工神经元的输出可描述为 式(2-1) 式中,是表示神经元输入-输出关系的函数,称为激活函数或输出函数。设是权与输入的矢量积(标量),相当于生物神经元由外加刺激引起的莫内点位的变化。这样激活函数可以写成。这里为了表达简单没有写出阈值θ。通常我们假设神经元有n-1个突触相连接,实际输入变量为。那么可设,,这样就加入了阈值这个量。 阈值一般不是一个常数,它是随着神经元的兴奋程度而变化的。因细胞在每次放电之后都需要一定的时间恢复,也就是说神经元的兴奋存在不应期,即相邻二次兴奋之间需要的时间间隔(大约为0.5-2.0ms),在此期间阈值会升高,即绝对不应期内的阈值会上升为无穷大。 激活函数有许多类型,其中比较常用的可以归结为三种形式:阈值型、S型和线性型。本文采用S型激活函数。 单极型S型(Sigmoid响应特性)激活函数的输出特性比较软,其输出状态的取值范围为[0,1]。特的输入输出关系由下图表示,式(2-2)是它的表达式。 图2-2 单极型的S型激活函数 式(2-2) 综上所述,神经元具有以下特点: 1、 神经元是一多输入、单输出的元件 2、 它具有非线性的输入、输出特征 3、 它具有可塑性,起诉性变化的部分主要是权值的变化,这相当于生物神经元的凸出部分的变化。 4、 神经元的输出响应是各个输入值的综合作用的结果。 5、 输入分为兴奋型(正值)和抑制型(负值)两种。 2.1.2 神经元网络的学习过程 模仿人的学习过程,人们提出了多种神经元网络的学习方式,其中主要有三种:有导师学习、无导师学习和强化学习。按学习方式进行神经元网络模型分类时,可以分为相应的三种,即有导师学习网络、无导师学习网络和强化学习网络。有导师型的学习或者说有监督型的学习是在有指导和考察的情况下进行的,如果学完了没有达到要求,那么就要再继续学习。无导师型的学习或者说无监督性的学习是靠学习者或者说神经系统本身自行完成的。这种学习没人监督,学到什么程度全靠大脑中的神经元网络的学习能力,最后也能把这种知识掌握到一定的程度。学习是一个相对持久的变化过程,往往也是一个推理的过程。例如通过经验也可以学习,学习是神经元网络最重要的能力。 本设计采用的学习过程为有导师学习过程,其模型大致如下。 图2-3 有导师学习网络 2.1.3 神经元网络的学习规则 神经元网络的最大特点就是它有学习的能力,在学习过程中,主要是网络的连接权的值产生了相应的变化,学习到的内容也是记忆在连接权之中。下面介绍连接权适量W(或者分量)是怎样在学习过程中被校正的。 令为第i个神经元的第j个输入连接权,这个输入可以是外来的输入信号,也可以来自其他神经元的输出。 这里,主要讨论单个神经元或单层网络的有监督学习以及简单的无监督学习。对于不同的学习规则,神经元的激活函数是不同的。阈值也可以包括在连接权矩阵里。 学习信号是和的函数,有时也包括教师信号,所以有 式(2-3) 权矢量Wi的变化是由学习步骤按时间t,t+1……一步一步进行计算的。在时刻t连接权的变化量为,其中c是一个正数,成为学习常数,决定学习的速率。从t时刻到下一个时刻t+1,连接权可按下式计算: 式(2-4) 离散学习步骤可写成 式(2-5) 其中c是一个正常数,成为学习常数,决定学习的速率。 2.2 Delta学习规则 仅对连续激活函数,并只对有监督学习模型有效。 学习信号为 式(2-6) 是激活函数对的导数。 这个学习规则可以从与最小方差得出。 方差 式(2-7) 式(2-8) 误差梯度矢量 式(2-9) 梯度矢量分量 式(2-10) 由于最小误差要求权变换是负梯度方向,所以取 式(2-11) 式中c——正常数。 式(2-12) 式(2-13) 式(2-14) 图2-4 Delta学习过程 2.3 BP网络 神经网络有很多种,本设计采用使用最广泛的BP网络。对多层网络的训练方法即误差逆传播算法(Error Back-Propagation Training)。主要意思是从后向前计算,所以把这种算法进行误差校正的多层前馈网络称为BP网络。 2.3.1 误差逆传播校正方法 误差逆传播校正方法是利用实际输出与期望输出的差值对网络的各层连接权由后向前逐层的进行校正的一种计算方法。下面分析一个三层网络模型的误差逆传播学习规则的原理。 这个网络的输入层有n个神经元,输出层有q个神经元,中间层有P个神经元。由于中间层与输入、输出端没有直接的联系,所以也常把中间层成为隐含层。首先把网络的变量设置如下: 输入层至中间层的连接权 中间层至输出层的连接权 中间层各单元的阈值 输出层各单元的阈值 其中;;; 这里激活函数采用S型函数: 式(2-15) 这里之所以选择S型函数作为BP网络神经元的激活函数,是因为它是连续可微分的,而且更接近生物神经元的信号输出形式。 激活函数的导数为 式(2-16) 这里的学习规则实际上是一种Delta学习规则,应使的调整量与的负值成正比例变化,所以中间层至输出层连接权的调整量应为 式(2-17) 通过推到,可得 式(2-18) 为了进一步简化,设为对输出层输入的负偏导,则 式(2-19) 所以 式(2-20) , , , 。 同理,输入层至中间层连接权的调整仍按梯度下降法的原则进行。与类似,连接权的调节量为: 式(2-21) 其中, 同样也可求出阈值的调整量,利用对于连接权的调整公式,取输出层的输入带入上式,则输出层阈值的调整量为: 式(2-22) 同理根据,取中间层的输入,则中间层的阈值的调整量为: 式(2-23) 以上的推到仅是针对某一组学习模式进行的,其误差也是某一组的误差。对于全部的输入模式,我们有网络的全局误差 式(2-24) 从以上推倒可以看出,各个连接权的调整量是分别于各个学习模式对的误差函数成正比例变化的,这种方法称为标准误差逆传播算法。 BP网络的学习规则实现的是学习模式集合上平方和误差(或)的梯度下降,而不是特定某个分量的绝对误差的梯度下降。因此,每次校正完后,网络输出端的误差对于某些神经元来说也有可能增加,但在进行多次反复计算后,其误差还是应该变小的。 2.3.2 BP网络的学习规则与计算方法 图2-5 多层前馈网络结构示意图 这是一种三层的BP网络,一般来讲,BP网是一种具有三层或三层以上的多层神经元网络,它的左、右各层之间各个神经元之间实现全连接,即左层的每一个神经元与右层的每个神经元都有连接,而同层内的各神经元无相互连接。BP网络按有教师学习方式进行训练,当一对学习模式提供给网络后,其神经元的激活值将从输入层经各中间层(隐层)向输出层传播,在输出层的各个神经元输出对应于输入模式的网络响应。然后,在减少希望输出与实际输出误差的原则,从输出层经各中间层、最后回到输入层逐层修正连接权。由于这种修正过程是从输出到输入逐层进行的,所以称它为“误差逆传播算法”。 由于BP网络有处于中间位置的隐含层,并有相应的学习规则可循,可训练这种网络,使其具有对非线性模式的识别能力。特别是它的数学意义明确、步骤分明的学习算法,更使它具有广泛的应用前景。 BP网络的学习过程主要由四部分组成: (1) 输入模式顺传播(输入模式由输入层经中间层向输出层传播计算), (2) 输出误差逆传播(输出的误差由输出层经中间层传向输入层), (3) 循环记忆训练(模式顺传播与误差逆传播的计算经过反复交替循环进行), (4) 学习结果判别(判定全局误差是否趋向极小值)。 2.3.3 BP网络学习整体步骤 (1)初始化,给各连接权、及阈值、赋予之间的随机值。 (2)随机选取一个模式对量为, 提供给网络。 (3)用输入模式,连接权和阈值计算中间层各神经元的输入(激活值),然后用通过激活函数计算中间层各单元的输出: 式(2-25) 式中: 式(2-26) (4)用中间层的输出、连接权和阈值计算输出层个单元的输入(激活值),然后用通过激活函数计算输出层各单元的响应 式(2-27) 式中: 式(2-28) (5)用希望输出模式,网络实际输出计算输出层个单元的校正误差: 式(2-29) (6)用,,计算中间层的校正误差: 式(2-30) (7)用,,和计算下一次的中间层和输出层之间的新连接权: 式(2-30) 式(2-31) 式中:N——学习次数。 (8)由,,和计算下一次的输入层和中间层之间的新连接权: 式(2-32) 式(2-33) (9)随机选取下一个学习模式对提供给网络,返回到第(3)步,直至全部m个模式对训练完。 (10)重新从m个学习模式对中随机选取一个模式对,返回到第(3)步,直至网络全局误差函数E小于预先设定的限定值(网络收敛),或学习回数大于预先设定的数值(网络无法收敛)。 (11)学习结束 在以上学习步骤中(3)-(6)为输入学习模式的“顺传播过程”,(7)-(8)为网络误差的“逆传播过程”,(9)和(10)则完成训练和收敛过程。BP网络学习过程框图如下图所示。 图2-6 BP网络学习过程图 第三章 图像的预处理 系统的程序实现分为图像预处理和神经网络识别两大模块。本章主要介绍图像预处理过程。在图像预处理过程中,采用了许多图像处理技术,最后把每个数字的特征提取出来。这些技术包括图像数据提取,图像的灰度化、二值化、图像的调整、离散噪点的去处、字符的切分、图像的缩放、字符的细化、字符的平滑等。 图3-1 初始读入的256色位图 3.1 256色位图灰度化 灰度图像就是图像的每一个像素R,G,B分量的值是相等的。彩色图像R,G,B的值是不相同的,所有显示出红绿蓝的各种颜色。灰度图像没有颜色的差异,只有亮度的不同。灰度值大的像素点比较亮(最大为255,白色),灰度值小的像素点比较暗(像素值最小为0,黑色)。灰度化有各种不同的算法,比较直接的一种就是给像素的RGB值各自一个加权系数,然后求和,同时还要对调色板表项进行相应的处理。最后得到的结果一定要归一到0—255之内,因为这是每个字节所表示图像数据的极限。 根据人眼对红绿蓝三色的敏感程度,可以使用以下比例式进行转换: 式(3-1) 经过灰度处理后的256色位图如图3-2所示。 图3-2 经过灰度处理的文件 3.2 灰度图像二值化 进行灰度处理后,图像的每个像素均只有一个值,即像素的灰度值。灰度值的大小决定了像素的明暗程度。为了更加便利的进行图像处理,还需要做二值化处理。二值化就是把图像中的像素根据一定的标准划分为两种颜色。本设计中划分为黑色和白色。二值化的方法很多,这里采用给定阈值的算法。因为考虑到所要处理的图像大多是从印刷物上扫描得来的,底色多为白色,所以将这个阈值固定为220。二值化实现的流程图如下。 图3-3 二值化流程图 图3-4 二值化后的图片 3.3 图像的梯度锐化 由于需要处理的图像大多是由印刷物上扫描而来的,所以很多情况下字体模糊,给识别带来一定程度的困难。所以进行锐化处理,使模糊的图像变得清晰,同时可以对噪声起一定的去除作用。图像锐化的方法很多,这里采用的方法属于微分法。采用Roberts梯度算子对图像进行锐化。 定义如下:设原始图像上的点为,定义在处的梯度矢量为: 式(3-2) 设一个判定阈值为,变化后的图像定义为: 式(3-3) 通过公式可以看出梯度锐化可以让模糊的边缘变得清楚,同时选择合适的阈值还可以减弱和消除一些细小噪声。梯度锐化具备一定的去噪声能力,但同时会对字符的边缘有所损伤。 图3-5 梯度锐化后的图像 3.4 去除离散的杂点噪声 图像可能在扫描过程中夹带了噪声,去除噪声是图像处理中的常用方法。通常去除噪声用滤波的方法,比如中值滤波,均值滤波。但这些算法不适合处理字符这样目标狭长的图像,因为在滤波的过程中很可能会去除掉字符本身的像素。这里采用的是去除杂点的方法进行去噪。具体算法如下:先扫描整个图像,当发现一个黑色点的时候,就考察和该黑色点间接或直接相连的黑色点的个数有多少,如果大于一定的值,那就说明该点不是离散点,否则就是离散点,应把它去掉。在考察相连的黑色点的时候用的是递归的方法。具体流程如下图所示。 图3-6 去处离散噪声流程图 图3-7 去除离散杂点噪声后的图像 3.5 整体倾斜度调整 因为读进来的图像有可能存在倾斜,所以必须进行调整,使得字符大致处于同一水平位置,这样既便于字符的分割,也可以提高字符识别的准确率。调整的算法主要是根据图像左右两边的黑色像素的平均高度来确定。一般来说,由众多的字符组成的图像,它的左右两边的字符像素的高度应该是处于水平位置附近的,如果两边字符像素的平均位置存在比较大的起落,那就说明图像存在倾斜,需要进行调整。具体来说,首先要分别计算机图像左半边和右半边的平均高度,然后求斜率,根据斜率重新组织图像,里面包含了一个从新图像到旧图像的像素映射。如果新图像的像素映射到旧图像中时- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 本科毕业 论文 基于 神经网络 数字 识别 系统 设计 正文
咨信网温馨提示:
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【胜****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【胜****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【胜****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【胜****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
关于本文