基于形状上下文的形状匹配和目标识别--大学毕业设计论文.doc
《基于形状上下文的形状匹配和目标识别--大学毕业设计论文.doc》由会员分享,可在线阅读,更多相关《基于形状上下文的形状匹配和目标识别--大学毕业设计论文.doc(23页珍藏版)》请在咨信网上搜索。
1、基于形状上下文的形状匹配和目标识别摘要:我们提出了一种测量图形间相似性的新方法,并开发它来做目标识别。 在我们的架构下,相似性的度量之前:1)解决两种形式下点与点的对应性2)利用这种对应性来估计一个对齐变换。为了解决对应问题,我们为每一个点附上一个形状上下文的描述。一个参考点的形状上下文能捕捉剩下与之相关的点的分布情况,从而提供全面的可识别的描述。两个相似图形上的对应点会有相似的形状语境,使我们将解决对应问题看做最优分配问题。给出点与点的对应,我们估计最佳匹配两种形状的变换,为这个用途,正则化薄板样条函数提供了灵活的图类转换。两个形状间的不同通过对应点间的匹配误差总和与测量对齐变换的大小项一起
2、来计算。我们把最近邻分类架构下的识别当作在图像上查找最大限度相似的存储原型问题,结果是轮廓线、商标、手写数字和线圈数据集。关键词:形状,目标识别,数字识别,对应性问题,MPEG7标准,图像配准,变形模板1 绪论考虑图1中的两个手写体数字。视为像素亮度值的向量使用二级规范相比,他们有很大的不同。但是,视为形状,它们显得和人类的观察员类似。我们在本文的目的是实施形状相似这一概念,其最终目的是用它作为概念层次识别的基础。我们通过一个三阶段的过程来实现:1、 解决这两个图形间的对应问题2、 使用对应关系来估算对齐变换3、 用对应点之间的匹配误差的总和,加上测量对齐变换的大小,来计算两个形状之间的距离我
3、们的做法的关键是传统的形状匹配变形,可至少追溯到达西汤普森。在他的经典作品中,对增长和形式55,汤普森指出,相关但不相同的形状,往往可以使用简单的坐标变换对齐,如图2所示的变形。在计算机视觉文献,费什勒和Elschlager15实施了在质量弹簧模型中使用mini-mization能源这一想法。Grenander等21在概率设置中发展了这个想法,Yuille61通过使用梯度下降的图像域下的手工制作的拟合参数化模型,如眼睛,来发展变形模板概念的另一变体。另一个众所周知的这一脉的计算方法是由Lades31等人通过lastic图匹配发展而来。我们在这项工作的主要贡献是发现形状之间对应关系的强大和简单的
4、算法。形状代表了一系列形状轮廓(通常为100左右从边缘探测器输出采样的像素位置)采样点。这里没有什么特别的点,它们不需标记或曲率极值等,使用的样本越多,我们获得越好的近似的基本形状。我们引进一个形状描述符,形状上下文,来描述对于给定一个的点的形状的其他部分的粗分布。两个形状之间的对应关系则相当于为一个形状上每个采样点找到其他形状上的最相似形状上下文。最大化的相似性和执行的独立性,导致一个二分图的匹配(等效,最优分配)问题。根据需要,我们可以很容易结合其他匹配的信息来源,例如在对应点的本地外观的相似性。给出采样点的对应关系,我们通过估计反应一个形状到另一个形状的映射的关系的对齐变换来延长通信完整
5、的形状。图2提供了这个想法的一个经典说明。转换可以从许多的家系中挑选,在各种应用中,我们已经使用了欧氏,仿射和正则化薄板样条函数。对齐形状,简单定义,就是形状相似性的衡量。两个形状之间的相异现在用对应点之间的匹配误差的总和,加上一个变形转换的幅度来测量。图1.两个手写体数字的例子。就像素到像素比较而言,这两个图像是相当不同的,但是人类的观察者看到的形状是相似的。针对这一差异性措施,我们可以使用最近邻技术来进行目标识别。哲学上,最邻近技术与Rosch4748等人开发的基于原型的识别有关。它们具备的优势,向量空间结构不是只需要一个成对相异的措施。我们证明了各种各样设置下的目标识别。我们处理2D对象
6、,例如,手写数字的MNIST数据集(图8),轮廓线(图11和13),以及使用多个视图建模的哥伦比亚线圈数据集中的3D对象(图10)。这些广泛使用的基准和我们的方法原来在其中有数据比较的问题中是领先的。我们还开发了一种基于视觉复杂性的为每个对象类选择其存储视图的技术。作为说明,我们在COIL-20数据集中的3D对象中表现了,能够获得低至2.5%的错误分类误差,只使用每个目标对象的4个视图的平均(见图9和10)。本文的结构如下:我们在第二部分讨论相关的工作,在第三部分详细描述形状匹配的方法,在第四部分展示变换模型。然后,我们在第五部分讨论形状相似性的度量,并在第六部分引用包括手写体数字和3D物体图
7、片在内的一系列数据集证明我们提出的方法。我们在第七部分进行总结。2 形状匹配的已有工作数学家通常定义形状为一群变换下的一个等价类。这个定义在视觉分析上下文中是不完全的。这只能告诉我们两个形状何时是完全相同的。至于形状相似或形状距离理论,我们需要的更多。统计学上定义的形状,Bookstein6或Kendall29,假定对应关系是已知的,致力于形状距离的问题。其它关于形状对应的统计学方法不需要对应关系,例如,人们可以比较包括描述符号的特征向量,但是这类技术经常在这个过程中丢弃详细的形状信息。形状相似性也还在心理学文献中被研究过,Goldmeier20就是早期的一个例子。关于计算机视觉方面的形状匹配
8、的广泛调查能够在5822中找到。概括地说,有两种方法:1)基于特征的,这个包括提取特征的空间安排,如边缘元素或连接点2)基于亮度的,这使得更直接的使用像素的亮度。2.1 基于特征的方法通过使用轮廓线图像的边界,已经做了大量关于形状相似性的研究。由于轮廓线没有孔或内部标记,相关边界可以方便的用弧长参数表示一个单一的封闭曲线来表示。早期的工作中使用傅里叶描述符,例如,6243。Blum的中轴变换,导致试图捕捉在Kimia,Zucker和Sharvit53等合作者的图形结构骨架中的形状的部分结构。1D轮廓线曲线的性质自然地导致动态规划方法的匹配,例如,17,它采用曲线间的编辑距离。对包括一些清晰度和
9、闭塞的几种变换,该算法是快速和不变的。做为MPEG-7标准的活动的一部分33,综合比较了不同形状描述符来比较的轮廓线,用由于Latecki等33和Mokhtarian39等领先的方法。图2.从D Arcy汤普森的生长形式55,有关坐标变换的两条鱼的例子。汤普森观察到类似的可能与生物形式之间的同源简单的数学变换手段(即对应)功能。同源功能的例子包括眼中心,背鳍尖端等。轮廓线是从根本上作为一般物体的性质描述的限制;他们忽视了内部的轮廓,很难从真实的图像中提取。更有前景的方法是把形状当作一套在二维图像里的点。从一张图像上提取这些算不了什么问题,例如,可以只使用一个边缘检测器。Hutten-loche
10、r等开发基于Hausdorff距离23的方法,这可扩展到处理部分匹配和杂波。我们的目的的一个缺点是,该方法不返回对应关系。基于距离变换的方法,如16,在实践中的精神和行为是相似的。Sclaroff和彭特兰的工作50代表特征向量或基于模式匹配的方法,见525157。在这种方法中,图像中的样本点转换为有限元弹簧-质点模型,对应关系通过比较振动模式发现。和我们的做法最密切相关的是Gold et al.19,Chui和Rangarajan9的工作,这将在第3.4部分讨论。有几种基于空间结构的一小部分要点或界标的方法可以进行形状识别。在几何哈希32中,这些配置用于投票给没有明确解决对应关系的模型。阿米特
11、1等人通过学习有判别力的空间配置关键点来训练识别决策树。Leung35等人,Schmid和Mohr49此外使用在关键点的灰度级的信息以提供更大的辨别力。应该指出,并不是所有的对象都有可分辨的关键点(例如考虑一个圆),单独使用关键点牺牲了在对象轮廓平滑部分可利用的形状信息。2.2 基于亮度的方法基于亮度(或外观)的方法提供了一个基于特征的方法的互补。与其侧重于咬合轮廓的形状或其他提取的特征,这些方法在对象的可见部分直接使用灰度值。人们可以在两个框架之一使用亮度信息。在第一类中,我们有方法使用灰度值来明确地对应关系/对齐。Yuille61提出了一个非常灵活的方法,特定种类变换的不变性可以构造成衡量
12、模型的相似性,但当通过梯度下降搜寻时,它需要人类设计的模板和对初始化的敏感性。Lades31等人使用弹性图匹配,这种方法涉及基于高斯衍生以局部描述符形式的几何和光学特性。Vetter59等人和Cootes10等比较亮度值,但是首次尝试使用密集的对应关系领域变形到另一个图像。第二类包括没有明确找到对应关系的建立分类的方法。这种方法,依赖于一个有足够的例子的学习算法获得相应的不变性。在人脸识别领域,特别是在概率框架下使用,采用主成分分析(PCA)5456,获得了好的效果。Murase和Nayar将这些想法应用到3D物体识别。一些作者已经在基于外观的形状匹配框架下应用有判别力的分类方法。 3 带形状
13、上下文的匹配在我们的方法中,我们把一个对象作为一个点集(可能是无限的),我们假设物体的形状基本上是由其点的一个有限子集捕获。实际上,一个形状可用其内部或外部轮廓采样点的离散集合来表示。这些可获得边缘探测器发现的边缘像素的位置,已给我们一套n个点,p=p,p, pR。他们不需要,通常不会对应关键点,如极大地曲率或拐点。我们宁愿样品形状大致均匀间距的,虽然这也不是关键。图3a和3b显示两个形状的采样点。假设轮廓分段光滑,只要挑选的n足够大,我们可以如愿得到一个良好的逼近底层的连续形状。3.1 形状上下文对于第一个形状上的每一个点p,我们要在第二个形状上找到最佳匹配点q,这是一个类似立体的对应问题。
14、经验也表明,如果使用丰富的局部描述符号,例如,灰度窗口或滤波器输出的矢量27,而不是仅仅是单个像素的亮度或边缘的位置,匹配更容易。丰富的描述符减少模棱两可的匹配。作为一个重要的贡献,我们提出了一个新的描述符,形状上下文,可以在形状匹配中发挥这样的作用。考虑从始发点到形状所有其他采样点的向量。这些向量表达了相对参考点的整个形状的配置。显然,这n-1个向量是一个丰富的描述,因为n变大,形状的表示形式越确切。作为形状描述符,全套的向量过于详细,因为在一个类别中形状和采样的表示形式可能会有所不同。作为一个更强大、紧凑且有高度判别力的描述符,我们确定相对位置分配。对于形状上的一个点p,我们计算出余下n-
15、1个点的相对坐标粗的直方图h, . (1)这个直方图被定义为点 p的形状上下文。我们使用统一的2维对数极坐标箱,使得附近样本点的位置描述符比更远样本点的位置描述符更为敏感。图3c就是一个例子。图3.形状上下文计算和匹配。(a)和(b)采样两个形状的边缘点。(c)计算形状上下文的对数极坐标直方图图解。我们是有5种log r和12种。(d)(e)(f)在(a)(b)中以标记的采样点的形状上下文范例。每个形状上下文是一个以参考点为原点,测量其余点的对数极坐标坐标系直方图。(暗=大值)注意和形状上下文的视觉相似性,这用于两个形状上相对相似点的计算。作为对比,的形状上下文完全不同。(g)对应使用二分匹配
16、,由直方图之间的x距离定义成本。考虑第一个形状上的点p和第二个形状上的点q。设C=C(p,q)表示符合这两点的成本。由于形状上下文作为直方图代表的分布,很自然地使用x检验统计: ,这里,h(k)和h(k)分别表示p和q的K-bin正则化直方图。匹配点的成本可以包括一个在点p和q基于局部外观相似性的额外项。当我们比较的形状来自灰度级图像而不是线条图形时,这是特别有用的。例如,可 以添加以p和q为中心的小灰度曲线之间的基于归一化相关分数的成本,点p和q处滤波器输出向量之间的距离,点p和q之间切线方向的不同,以此类推。选择这个外观相似项依赖于应用,由必要的不变性和鲁棒性要求驱动,例如,不同的照明条件
17、使依赖于灰度的亮度值冒险。3.2 二分图匹配鉴于所有成对的第一个形状上的点p和第二个形状上的点q的成本集,我们想尽量减少匹配的总成本, (2)受约束的匹配是一对一的匹配,即,是一个排列。这是一个平方配置(或加权二部图匹配)问题的实例,使用Hungarian方法42可以在时间复杂度O(n)内解决。在我们的实验中,我们使用更有效地算法28。配置问题的输入是一个包含C条目的平方成本矩阵,结果是使式(2)最小化的一个排列。为了有强大的离群值处理能力,在匹配成本恒定的情况下,为每个点添加“虚拟”点集。在这种情况下,不论有没有真正匹配的比更小的成本,一个点将被匹配到一个“虚拟”。因此可视为一个门槛异常检测
18、参数。同样,当两个形状上的采样点数目不同时,成本矩阵可通过给点数目较少的形状增加虚拟节点来创造。3.3 不变性和鲁棒性一个匹配的方法应为1)缩放和平移不变性2)小几何变形、闭塞和存在离群值的鲁棒性。在些应用中,可能要完成旋转不变性,或者甚至全组的仿射变换。我们现在用这些标准来评估形状上下文匹配。平移不变性是形状上下文内在的定义,因为所有的测量是对对象上的点采取的。为实现模型的不变性,我们用形状上n对点之间的平均距离归一化径向距离。由于形状上下文是极为丰富的描述符,他们本质上对形状上的部分小扰动不敏感。虽然我们这里没有理论保证,小的非线性变换,闭塞和存在离群值的鲁棒性在第4.2部分被通过实验评估
19、。在形状上下文框架,如果这是应用需求的,我们可以提供完整的旋转不变性。取代使用绝对框架计算每个点的形状上下文,我们可以使用相对框架,基于将每个点的切向量当做正x轴。这样,参照系根据切线角度转动,结果是一个完全旋转不变描述符。在附录A中,我们在实验上证明了这一点。应该强调,在许多应用中,完全的不变性妨碍识别性能,例如,区分6、9时,旋转不变性将会完全不恰当。另一个缺点是,许多点不会有明确界定的或可靠地切线。此外,如果不是在同一坐标系测量,许多局部外观特征将失去辨别力。附加到离群值的鲁棒性,可以通过从它的形状上下文计算中排除估计离群值来获得。更具体地说,考虑一个被贴上给定迭代的点集。我们提供这些“
20、隐形”的点,不允许它们为直方图做出任何贡献。但是,我们仍然分配给他们形状上下文,考虑到只有周围内层的点,使它们在以后的迭代中有机会作为内层再度出现。3.4 相关工作在这个一般设置中,关于形状对应的最综合的工作是Gold等人19和Rangarajan9的工作。他们开发了一个迭代优化算法,以确定点对应关系和连带的底层图像转换,通常假设一些通用转换;类,如仿射或薄板样条。最小化的成本函数是第一个形状上的点和转换的第二个形状之间的欧式距离的总和。这将产生一个鸡和蛋的问题:只有当至少有一个形状的粗校准,距离才有意义。联合估计的对应关系和形状转换导致一个难的高度非凸优化问题,这用确定性退火19可以解决。形
21、状上下文是一个非常有判别力的点描述符,通过将全部形状信息纳入本地描述符来促进简单和可靠地对应关系恢复。据我们所知,形状上再问和其用于2D形状匹配是新颖的,在过去的工作中关系最密切的想法是约翰逊和赫伯特 26在范围图像的工作。他们提出了一个表示3D点的致密匹配云,被称为“自旋图像”。自旋图像是一个2D直方图,由在一个平面上旋转的对象表面的法线向量和计数下跌在平面内的点个数组成。由于这个平面的规模相对较小,由此产生的有特征的符号不如作为用于恢复对应关系的形状上下文内容丰富。然而这个特性,可能有额外的鲁棒性闭塞的权衡。另一项相关的工作,Carlsson8为表征局部形状配置,利用了秩序结构的概念。在这
22、项工作中,点和形状的切线之间的关系用于恢复对应关系。4 建模转换提供有限的两个形状的点之间的对应关系集,就可以得到一个平面转换估计,可以用来将任一点映射到另一个形状。这个想法由图2 中扭曲的网格线说明,这里指定的对应关系包括少量的标记点,如眼中心,背鳍的尖端等,并且T延伸到任意点的对应。我们需要从一个合适的转换家系选择T。一个标准的选择是仿射模型,即 (3)一些矩阵A和一个平移偏移向量o参数化所有允许转换集。然后,最小二乘解=(,)可通过以下获得 , (4) , (5)其中,P和Q包含P和Q的齐次坐标,即 . (6)这里,Q代表Q的伪逆。在这个工作中,我们大多使用薄板样条(TPS)模型1437
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 形状 上下文 匹配 目标 识别 大学 毕业设计 论文
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【a199****6536】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【a199****6536】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。