计算机视觉技术概述.doc
《计算机视觉技术概述.doc》由会员分享,可在线阅读,更多相关《计算机视觉技术概述.doc(27页珍藏版)》请在咨信网上搜索。
1、计算机视觉现状及应用发展研究目 录摘 要2绪 论2第一章 概述21.1 计算机视觉技术是什么21.2 计算机视觉技术的原理2第二章 计算机视觉技术的发展22.1 计算机视觉技术的发展22.2 计算机视觉现状2第三章 计算机视觉技术的应用23.1 应用概述23.2视觉测试技术23.3计算机视觉在工农业检测中的应用2第四章 计算机视觉技术的图像处理方发24.1 图像的增强24.2图像的平滑24.3 图像的数据编码和传输24.4 边缘锐化24.5 图像的分割24.5.1数据驱动的分割24.5.2模型驱动的分割24.5.3图像分割的半自动方法24.6 图像的识别24.7视觉技术的研究24.7.1计算机
2、视觉研究的对象与方法24.7.2计算机视觉的应用领域2第五章 计算机视觉的发展趋势25.1 计算机视觉的发展趋势2参考文献2摘 要计算机视觉技术集数字图像处理、数字信号处理、光学、物理学、几何学、应用数学、模式识别7XA工智能等知识于一体其应用已经涉及到计算几何、计算机图形学、图像处理、机器人学等领域。文中简要地回顾了计算机视觉技术的发展史。利用工业摄像镜头替代目视作为传感器,通过图像采集。图像处理,图像识别等一系列操作。达到在线对包装产品进行标签检测的目的。关键词 计算机视觉 图像处理 视觉系统 图像识别 检测 标签绪 论计算机视觉系统一般有光源、摄像机、采集卡及PC软件系统等组成,可以完成
3、图像的采集与处理、目标的识别功能,视觉系统的结构一般是从系统的模型的角度理解的。计算机视觉既是工程领域,也是科学领域中的一个富有挑战性重要研究领域。计算机视觉是一门综合性的学科,它已经吸引了来自各个学科的研究者参加到对它的研究之中。其中包括计算机科学和工程、信号处理、物理学、应用数学和统计学,神经生理学和认知科学等。计算机视觉学所研究的对象,简单地说就是研究如何让计算机通过图象传感器或其它光传感器来感知、分析和理解周围环境。人类感知外界环境主要通过视觉,听觉和触觉等四大感觉系统。其中视觉系统是最复杂的。人类从外界获得的信息中视觉信号量最大。模仿人类的视觉系统,计算机视觉系统中信息的处理和分析大
4、致可以分成两个阶段:图象处理阶段又称视觉处理中的低水平和中水平阶段;图象分析、理解阶段又称视觉处理中的高水平处理阶段。在图象分析和理解阶段,计算机根据事先存贮在数据库中的预知识模型,识别出各个基元或某些基元组合所代表的客观世界中的某些实体称之为模型匹配以及根据图象中各基元之间的关系在预知识的指导下得出图象所代表的实际景物的含义,得出图象的解释或描述。必须强调,预知识在视觉系统中起着相当重要的作用。在预知识库中存放着各种实际可能遇到的物体的知识模型,和实际景物中各种物体之间的约束关系。计算机的作用是根据被分析的图象中的各基元及其关系,利用预知识作为指导,通过匹配,搜索和推理等手段,最终得到对图象
5、的描述。在整个过程中预知识时刻提供处理的样板和证据。每一步的处理结果随时同预知识进行对比。有时,处理的中间结果和最终结果还要馈送给预知识库作为知识的更新和积累。第一章 概述1.1 计算机视觉技术是什么计算机视觉(ComputerVision,CV)是一门研究如何让计算机达到人类那样“看”的学科。更准确点说,它是利用摄像机和电脑代替人眼使得计算机拥有类似于人类的那种对目标进行分割、分类、识别、跟踪、判别决策的功能。计算机视觉是使用计算机及相关设备对生物视觉的一种模拟,是人工智能领域的一个重要部分,它的研究目标是使计算机具有通过二维图像认知三维环境信息的能力。计算机视觉是以图象处理技术、信号处理技
6、术、概率统计分析、计算几何、神经网络、机器学习理论和计算机信息处理技术等为基础,通过计算机分析与处理视觉信息。作为一个新兴学科,计算机视觉是通过对相关的理论和技术进行研究,从而试图建立从图像或多维数据中获取“信息”的人工智能系统。计算机视觉是一门综合性的学科,它已经吸引了来自各个学科的研究者参加到对它的研究之中。其中包括计算机科学和工程、信号处理、物理学、应用数学和统计学,神经生理学和认知科学等。计算机视觉也是当前计算机科学中的一个非常活跃的领域,计算机视觉领域与图像处理,模式识别,投影几何,统计推断,统计学习等学科密切相关,近年来,与计算机图形学,三维表现等学科也发生了很强的联系。目前,计算
7、机视觉技术已经应用在制造业、工业检验、文档分析、医疗诊断、军事目标跟踪、自主导航等系统当中1.2 计算机视觉技术的原理计算机视觉就是用各种成象系统代替视觉器官作为输入敏感手段,由计算机来代替大脑完成处理和解释。计算机视觉的最终研究目标就是使计算机能象人那样通过视觉观察和理解世界,具有自主适应环境的能力。要经过长期的努力才能达到的目标。因此,在实现最终目标以前,人们努力的中期目标是建立一种视觉系统,这个系统能依据视觉敏感和反馈的某种程度的智能完成一定的任务。例如,计算机视觉的一个重要应用领域就是自主车辆的视觉导航,还没有条件实现象人那样能识别和理解任何环境,完成自主导航的系统。因此,人们努力的研
8、究目标是实现在高速公路上具有道路跟踪能力,可避免与前方车辆碰撞的视觉辅助驾驶系统。这里要指出的一点是在计算机视觉系统中计算机起代替人脑的作用,但并不意味着计算机必须按人类视觉的方法完成视觉信息的处理。计算机视觉可以而且应该根据计算机系统的特点来进行视觉信息的处理。但是,人类视觉系统是迄今为止,人们所知道的功能最强大和完善的视觉系统。如在以下的章节中会看到的那样,对人类视觉处理机制的研究将给计算机视觉的研究提供启发和指导。因此,用计算机信息处理的方法研究人类视觉的机理,建立人类视觉的计算理论,也是一个非常重要和信人感兴趣的研究领域。这方面的研究被称为计算视觉(Computational Visi
9、on)。计算视觉可被认为是计算机视觉中的一个研究领域。第二章 计算机视觉技术的发展2.1 计算机视觉技术的发展计算机视觉是在20世纪50年代从统计模式识别开始的当时的工作主要集中在二维图像分析和识别上,如光学字符识别工件表面、显微图片和航空图片的分析和解释等60年代,Roberts(1965)通过计算机程序从数字图像中提取出诸如立方体、楔形体、棱柱体等多面体的三维结构,并对物体形状及物体的空间关系进行描述Roberts 1965。到了70年代,已经出现了一些视觉应用系统Guzman 1969,Maekworth 1973,。70年代中期,麻省理工学院(MIT)人工智能(AI)实验室正式开设“机
10、器视觉”(Machine Vision)课程,由国际著名学者BKPHom教授讲授。80年代以来,计算机视觉的研究已经历r从实验室走向实际应用的发展阶段。而计算机工业水平的飞速提高以及人工智能、并行处理和神经元网络等学科的发展,更促进了计算机视觉系统的实用化和涉足许多复杂视觉过程的研究。目前,计算机视觉技术正在广泛的应用于计算几何、计算机图形学、图像处理、机器人学等多个领域中。二十年前,计算机的出现使工作场所出现革命化发展。直到现在,约75的办公室工作通过计算机和互联网来实现。1990年,大约15美国家庭拥有了一台计算机,现在增加到70。计算机视觉(Computer v|si0n)一词最早出现在
11、PHWestonl 975 年的论文中。计算机视觉是以视觉处理理论为中心,属于人工智能范畴的一个新领域 。它也是以图像处理、模式识别、计算机技术和生理学心理学为基础的信息处理科学中的一个重要分支。计算机视觉技术集数字图像处理、数字信号处理、光学、物理学、几何学、应用数学、模式识别及人工智能等知识于一体,其应用已经涉及到计算几 何、计算机图形学、图像处理、机器人学等领域。计算机视觉既是工程领域,也 是科学领域中的一个富有挑战性重要研究领域。 计算机视觉研究的目标有两个:一个是开发从输入的图像数据自动构造场景描述的图像理解系统,另一个是理解人类视觉,以便有朝一日用机器代替人去作人类难以达到或根本无
12、法达到的工作。当前,计算机视觉也是人工智能及机器人科学中颇为活跃的和卓有成效的热门研究课题。 视觉理解是计算机视觉系统的一个重要处理环节,当前,具有视党反馈功能的机器人已能代替人完成各种复杂的任务,如:产品的自动装配、焊接和检验、生物医学中的自动诊断、遥感照片的自动解释、各种车辆的自动导航等。这种赋予机器以类似人的视觉信息处理能力并为人类自身服务的美好愿望在一定范围或特定任务下已部分地成为现实。今天,计算机视觉的应用已渗透到机器人、天文、地理、医学、化学、物理等宏观及微观世界的各个研究领域。有人预言,计算机视觉是实现智能机器人和第五代计算机的关键因素之一。 计算机视觉是一个复杂的处理过程,景物
13、理解及景物分析是其处理要点之一。用机器实现景物理解必须将输入的图像和预先存入的有关物体结构和环境约束知识进行交互作用,建立明确而有意义的描述理解。这种过程可归结为从一幅图像中提取景物信息,完成某些计算,在不同阶段的理解过程引入相关的先验知识,从而完成理解处理。类似的工作实际上早在50年代就已经开始了。目前,三维物体及景物分析工作的重点在三维物体与自然景物的识 与分析上。80年代,在计算机视觉研究中占主导地位的是Mart教授提出的视觉计算理论框架,在这种框架下,Marr认为视觉可看做是三个层次的信息处理过程,而且要从计算理论、算法描述及硬件实现三个方面去实现三个层次的工作。三维物体识别研究自Ma
14、rt教授创立视觉计算理论后取得了重大进展。这一理论的要点在于把视觉看成一个过程,它从外部世界的图像逐步产生对景物的三个层次的描述,即: a)初始简图 这是基本意义的灰度变动的局部几何性质,以线条勾画出的草图形式出现 b)二维半简图 该图主要描述物体可视面的表面方向和观察点到表面的距离 c)三维模型表示 这是物体形状的全部而清晰的描述。有人认为,Marr教授的视觉计算理论是肘计算机视觉研究的最杰出的贡献。 90年代,Rosenfeld认为应重视三个方面的工作,一是计算的鲁棒性问题,二是主动视觉(active vision)的研究,三是定性视觉的研究(qualitative vision)。有人把
15、视觉定义为“根据获得的图像理解景物信息的处理过程 ,而计算机视觉主要是利用计算机提供的手段和方法去完成这一信息处理过程。具体包括:视觉信息的获取 图像预处理、分割、描述、识别理解等几步工作。1965年,LRoberts关于“三维物体的感知”一文提出了几种获取三维信息的基本方法。这些基本方法至今还被计算机视觉研究领域普遍采用。目前,获取视觉信息的主要方法有主动法和被动法两大类,主动法需要对测试物体加入特殊的人造光源 其中包括:三角光法、结构光法和飞行时间法。三角光法类似三角测量法,此法需逐点测量,费时较多。结构光法是把已知结构的图像投影到被渊物体表面,由于该物体表面的取向不同,标准图案会产生畸变
16、,利用这畸变可算出物体表面的三维坐标。标准图像一般用细线、方格等。这种方法最早由日本学者YShirai提出,具体做法可采用激光扫描或投影仪来实现。飞行时间测距法是以雷达原理为基础的方法。这种方法可直接测得物体表面距离而获得三维信息,它不涉及图像处理问题。具体实现可采用激光雷达或超声雷达,超声雷达的缺点是聚焦比较困难,但是处理方法比较简单。 被动法是在自然光条件下获得三维信息的方法。其中包括:体视法、阴影恢复形状法、由运动恢复形状法、纹理恢复形状和灰度体视法等。体视法与人的视觉原理有许多相似之处,由不同位置上的摄像机获取两幅(或多幅)图像,根据三角测量原理,利用立体图像中的对应点的视差计算出景物
17、的三维信息。因此,两幅图像的匹配是体视法的关键。早期的匹配主要基于区域的灰度相关计算,现代方法则侧重于特征匹配。因而,只能获得稀疏的特征信息,要用各种内插法获取整幅图像的三维信息。体视法体现了Marr教授的理论精髓。形状分析法是根据图像中灰度阴影分布、物体的运动、纹理结构等信息分析计算景物的三维信息。运动序列图像分析法是依靠物体或摄像机运动时得到多幅序列图像,通过对三维运动参数的计算分析获取三维信息。此方法基本属于形状分析法,它在计算机视觉研究中较受重视,已成为一个重要分支。总之,三维信息获取是计算机视觉研究的基础,也是目前非常活跃的课题之一。无论在理论上还是实践上都有举足轻重的作用 三维信息
18、获取中的重要环节 三维定标系统研究也是极受重视的课题。为提高定标的精度曾做了大量的研究工作,并提出了不少算法。2.2 计算机视觉现状计算机视觉领域的突出特点是其多样性与不完善性。这一领域的先驱可追溯到更早的时候,但是直到20世纪70年代后期,当计算机的性能提高到足以处理诸如图像这样的大规模数据时,计算机视觉才得到了正式的关注和发展。然而这些发展往往起源于其他不同领域的需要,因而何谓“计算机视觉问题”始终没有得到正式定义,很自然地,“计算机视觉问题”应当被如何解决也没有成型的公式。尽管如此,人们已开始掌握部分解决具体计算机视觉任务的方法,可惜这些方法通常都仅适用于一群狭隘的目标(如:脸孔、指纹、
19、文字等),因而无法被广泛地应用于不同场合。对这些方法的应用通常作为某些解决复杂问题的大规模系统的一个组成部分(例如医学图像的处理,工业制造中的质量控制与测量)。在计算机视觉的大多数实际应用当中,计算机被预设为解决特定的任务,然而基于机器学习的方法正日渐普及,一旦机器学习的研究进一步发展,未来“泛用型”的电脑视觉应用或许可以成真。人工智能所研究的一个主要问题是:如何让系统具备“计划”和“决策能力”?从而使之完成特定的技术动作(例如:移动一个机器人通过某种特定环境)。这一问题便与计算机视觉问题息息相关。在这里,计算机视觉系统作为一个感知器,为决策提供信息。另外一些研究方向包括模式识别和机器学习(这
20、也隶属于人工智能领域,但与计算机视觉有着重要联系),也由此,计算机视觉时常被看作人工智能与计算机科学的一个分支。物理是与计算机视觉有着重要联系的另一领域。计算机视觉关注的目标在于充分理解电磁波主要是可见光与红外线部分遇到物体表面被反射所形成的图像,而这一过程便是基于光学物理和固态物理,一些尖端的图像感知系统甚至会应用到量子力学理论,来解析影像所表示的真实世界。同时,物理学中的很多测量难题也可以通过计算机视觉得到解决,例如流体运动。也由此,计算机视觉同样可以被看作是物理学的拓展。另一个具有重要意义的领域是神经生物学,尤其是其中生物视觉系统的部分。在整个20世纪中,人类对各种动物的眼睛、神经元、以
21、及与视觉刺激相关的脑部组织都进行了广泛研究,这些研究得出了一些有关“天然的”视觉系统如何运作的描述(尽管仍略嫌粗略),这也形成了计算机视觉中的一个子领域人们试图建立人工系统,使之在不同的复杂程度上模拟生物的视觉运作。同时计算机视觉领域中,一些基于机器学习的方法也有参考部分生物机制。计算机视觉的另一个相关领域是信号处理。很多有关单元变量信号的处理方法,尤其是对时变信号的处理,都可以很自然的被扩展为计算机视觉中对二元变量信号或者多元变量信号的处理方法。但由于图像数据的特有属性,很多计算机视觉中发展起来的方法,在单元信号的处理方法中却找不到对应版本。这类方法的一个主要特征,便是他们的非线性以及图像信
22、息的多维性,以上二点作为计算机视觉的一部分,在信号处理学中形成了一个特殊的研究方向。除了上面提到的领域,很多研究课题同样可被当作纯粹的数学问题。例如,计算机视觉中的很多问题,其理论基础便是统计学,最优化理论以及几何学。如何使既有方法通过各种软硬件实现,或说如何对这些方法加以修改,而使之获得合理的执行速度而又不损失足够精度,是现今电脑视觉领域的主要课题。第三章 计算机视觉技术的应用3.1 应用概述智能计算机不但使计算机更便于为人们所使用,同时如果用这样的计算机来控制各种自动化装置特别是智能机器人,就可以使这些自动化系统和智能机器人具有适应环境,和自主作出决策的能力。这就可以在各种场合取代人的繁重
23、工作,或代替人到各种危险和恶劣环境中完成任务。应用范围从任务,比如工业机器视觉系统,比方说,检查瓶子上的生产线加速通过,研究为人工智能和计算机或机器人,可以理解他们周围的世界。计算机视觉和机器视觉领域有显著的重叠。计算机视觉涉及的被用于许多领域自动化图像分析的核心技术。机器视觉通常指的是结合自动图像分析与其他方法和技术,以提供自动检测和机器人指导在工业应用中的一个过程。在许多计算机视觉应用中,计算机被预编程,以解决特定的任务,但基于学习的方法现在正变得越来越普遍。计算机视觉应用的实例包括用于系统:(1)控制过程,比如,一个工业机器人 ;(2)导航,例如,通过自主汽车或移动机器人;(3)检测的事
24、件,如,对视频监控和人数统计 ;(4)组织信息,例如,对于图像和图像序列的索引数据库;(5)造型对象或环境,如,医学图像分析系统或地形模型;(6)相互作用,例如,当输入到一个装置,用于计算机人的交互;(7)自动检测,例如,在制造业的应用程序。其中最突出的应用领域是医疗计算机视觉和医学图像处理。这个区域的特征的信息从图像数据中提取用于使患者的医疗诊断的目的。通常,图像数据是在形式显微镜图像,X射线图像,血管造影图像,超声图像和断层图像。的信息,可以从这样的图像数据中提取的一个例子是检测的肿瘤,动脉粥样硬化或其他恶性变化。它也可以是器官的尺寸,血流量等。这种应用领域还支持通过提供新的信息,医学研究
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机 视觉 技术 概述
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【w****g】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【w****g】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。