贝叶斯分类器在手写数字分类识别中的应用.pdf
《贝叶斯分类器在手写数字分类识别中的应用.pdf》由会员分享,可在线阅读,更多相关《贝叶斯分类器在手写数字分类识别中的应用.pdf(5页珍藏版)》请在咨信网上搜索。
1、伺服控制SERVOCONTROL贝叶斯分类器在手写数字分类识别中的应用Application of Bayesian Classifier in Handwritten Digit Classification and Recognition何煦(HeXu)盐城工学院土木工程学院摘要:手写体数字识别技术是一种非常重要的技术,将带来巨大的社会效益和经济效益。但是到目前为止,对手写数字进行识别的准确率仍需要进一步提高。针对这种情况,本文提出了一种基于贝叶斯分类器的手写体数字分类识别方法,能够有效识别书写规范的数字。关键词:图像处理;贝叶斯分类器;手写数字Abstract:Handwritten d
2、igit recognition technology is a very important technology that will bring huge social andeconomic benefits.However,so far,the accuracy of recognizing handwritten digits still needs to be further improved.In response to this situation,this article proposes a handwritten digit classification and reco
3、gnition method based on aBayesian classifier,which can effectively recognize digits with standardized writing.Keywords:Image processing;Bayesian classifier;Handwritten digits【中图分类号】TP753【文献标识码】B【文章编号】1 56 1-0 330(2 0 2 4)0 3-0 0 9 2-0 51“手写字符识别技术”现状手写字符识别包括对在线手写体字符识别和脱机手写体字符的识别。在线手写体识别的基本原理是通过记录下笔与提
4、笔的顺序、位置和中间形成的笔迹的像素位置进行识别。在这一过程中,系统会根据先前设定的规则和编写的程序对写下的信息进行特征提取,将所提取的特征与库的特征进行对比,转化成能够被计算机进行处理的数字信息,在线识别有一个很大的缺陷,那就是需要在类似于手写板的特定的装置上书写。所谓的脱机也就是离线,所有离线识别就是通过像数码相机、扫描仪等图像采集设备,把手写的字符保存为图片的形式,再通过使用数据线输送到计算机并在计算机上识别。近年以来,来自世界各地的研究者们开发了很多方法,这些方法主要有:结构特征、统计特征和人工神经网络等等。基于结构特征的方法通常是记录图像的端点个数、交点个数、弯曲程度、轮廓大小等特征
5、。如果图像过于复杂,可以对预处理过后的图像进行分解,分解为多个小模式乃至基本单元,通过基于统计特征的方法,对划分的基本单元进行统计从而进行分类和识别。92THEWORLDOFINVERTERS但是,不论采取何种识别方法,对图像的预处理操作都是必不可少的。在实验中,使用哪一种方法都不能实现全部识别正确,这表明每种研究方法都是有所缺陷的。2基于“贝叶斯分类器的系统识别方法设计本文主要是解决识别手写体数字图像的问题。由三个主要部分组成:第一部分是对原始图片进行一系列的预处理操作,第二部分是对处理过后的图像进行特征提取,第三部分是设计贝叶斯分类器,对上一个步骤中所得到的特征信息进行处理,并且对设计出的
6、算法进行测试和分析。第一步是图像预处理:预处理是将原始图像转化成二进制格式,再通过计算机进行运算和处理。为了消除噪声和亢余信息,保持点阵规范化是图像预处理的首要目标,从而为图像的分类与识别奠定基础。一般情况下,当把手写数字输入到图像中时,其笔划的粗细、结构的倾斜度等都会在某种程度上造成干扰,比如,其结构特性与字体的粗细有很大关系。手工书写第2 7 卷第0 3期变频器世界2 0 2 4年0 3月造成的笔迹倾斜、笔画粘连等等直接影响图像的清晰度,在预处理过后,可能会出现大面积的黑影,显著降低了图像的质量,对识别产生严重的干扰,这也就直接影响了最后的识别结果的精度。因此,这就对预处理的要求比较高,在
7、充分剔除不相关的信息的同时,又要尽可能地保留原有的特征。在图像识别中,需要针对于不同的图像,选择最合适的预处理过程,然后将其传递给分类算法模块,以提高手写体数字的识别准确率。本次设计的预处理分为三步:灰度化、二值化、去噪。灰度化就是指把原始的RGB图像通过计算机算法变成只体现亮度信息的灰色图像。RGB图片是彩色图像的一种表现形式。三个同样大小的数组可以代表一个像素,每个数组分别表示红、绿、蓝三种颜色的分量。众所周知,红绿蓝是三原色,只要配合不同的比例就可以合成任何颜色,所以每个像素的颜色取决于三种基色所占的比例。如图1 所示。虽然灰度图像与彩色图像相比失去了色彩,但是仍然包含亮度信息,而且这个
8、亮度信息的变化是连续的,依然可以反映出整体和局部的亮度特征。在图像处理中,通常都会使用灰度图像,因为这类图像都是2 56 的调色板,使得图像数据的每个字节就对应一个像素,非常整齐。222图1 灰度化图像图2 二值化图像二值化就是把图像的各个像素分离成“0”和“1”。二值图像就是由成千上万的“o”和“1”构成的矩阵,如图2 所示。这类图像最突出的特点就是占用的空间很小,而且对图像进行布尔运算更为简单快捷。因此,只要是需要进行图像的处理,都少不了图像的二值化。在图像的二值化过程中,最为重要的就是选择最合理的阈值。这个值是用来把灰度值进行分类的。如果某个点的RGB值大于或者等于设定的阈值,那么就规定
9、它的RGB值为“2 55”,即二值图像中的“1”,表示大于或则等于阈值的像素群,反之就规定它的RGB值为“0”,即二值图像中的“0”,表示小于阈值的像素群。要想在最后的分类和识别中获得较高的识别率,二值化图像的笔画必须较好地保持原手写数字图像的数字特征。在MATLAB中,有专门的设定阈值的函数graythresh”,这个函数的功能就是自动选择一个最佳阈值。一般来说,这个阈值要比人为设定的更加精确。图像的二值化对后续处理非常重要,它不仅能有效地压缩图像数据,而且更能突出手写数字的轮廓。一般来说,在图像处理、特征提取、识别之前都需要进行二值化。去噪,即去除二值图像中通常存在的一些黑色或者白色凌乱孤
10、立的点,事实上,这就是孤立点噪声,我们又称之为椒盐噪声。这些噪声会对特征提取时产生或大或小的干扰,如改变数字的轮廓、影响提取的特征等等,从而对识别产生干扰。所以,要想提高识别的精度,就需要采用某种滤波把噪声进行去除。而对于这种椒盐噪声,一般采取中值滤波。第二步是特征提取。特征提取的目标是将高维的模式类别转换成相比之下维数很低的特征空间,并且还能保留图像的本质特征,即保留分类识别需要的信息。很大程度上降低了运算的复杂程度。能从预处理后的图像中提取出属于其本质的特征就是特征提取的主要目的。特征提取分为结构特征提取、像素特征提取、粗网格特征提取三类。结构特征提取,需要对数字的结构进行分析,记录下计算
11、端点、指定方向的交叉点个数,将其作为特征向量,建立起一个特征库。为了实现识别的目的,通过结构特征提取分析图像中的数字结构是一个非常直观的方法。但其不足之处在于,其特征的提取、模板的建立以及匹配算法都是非常复杂的;像素特征提取是针对二值图像而言的,因为这种方法是把处理后的二值图像进行全面扫描,遇到的像素点是黑色就记录这一点的特征为“0”,同理,遇到的像素点是白色就记录这一点的特征为“1”。有许多方法可以提取像素分布,例如水平和垂直投影特征,微结构特征和边缘特征等等;粗网格的特征提取的大体思路就是把需要提取的对象进行切分,分成几个大小几乎相等的网格,然后对每个网格中的像素所占比例进行计算,每个网格
12、中统计出的占比就是相应的特征值,所有的特征值组成的特征向量就是这幅图像的网格特征。本文采用粗网格特征提取的方式,一方面可以确定WWW.CA168.COM93伺服控制SERVOCONTROL待测图像中数字的特征,另一方面还有利于减少人为书写方式不同而产生的干扰,并且这种方法实现起来较为简单。在MATLAB中,编写了Feature_Extraction函数,通过对经过预处理的手写数字图像进行分割,获取数字图像的上下左右的边界,并且命名为“当前手写数字”,并且保存,格式为“bmp”。把保存的图像,通过size函数得到它的维数,除以5并用fix函数进行取整,这样就可以得到55的网格。接着对这2 5个网
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 贝叶斯 分类 在手 数字 识别 中的 应用
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。