结合轮廓与姿态的时空融合步态识别方法.pdf
《结合轮廓与姿态的时空融合步态识别方法.pdf》由会员分享,可在线阅读,更多相关《结合轮廓与姿态的时空融合步态识别方法.pdf(8页珍藏版)》请在咨信网上搜索。
1、步态识别是利用步态信息对人的身份进行识别的技术。与指纹、虹膜、人脸等生物特征识别方法相比,步态识别具有采集容易、距离远、非接触、难以伪装和无需配合等优点1-3。随着计算机视觉和人工智能技术的快速发展,结合步态识别的公共安防系统和智能视频分析系统,在保障社会公共安全,提高智慧城市的科学化管理水平等方面存在广泛的技术需求,其发展也受到工业界的密切关注4-6。步态识别的基本目标是从身体的变化过程中学习到独特且不变的表征。目前大多数的步态识别方法是基于轮廓的步态识别方法。轮廓由行人的原始图像获得,从人体的外形轮廓的角度描述了人体的运动过程。然而轮廓容易受到诸如服装和携带物等遮挡因素的影响,在这些遮挡情
2、况下,轮廓出现严重变形且不再准确地反映行人的身体状态,导致步态识别的准确率出现明显下降。现有的一些步态识别方法希望从轮廓图中提取更加鲁棒的步态特征来抵抗遮挡。例如,Zhang等7提出了一种新的自动编码器框架,利用 LSTM(long结合轮廓与姿态的时空融合步态识别方法张超越,张荣宁波大学 信息科学与工程学院,浙江 宁波 315211摘要:现有的大多数步态识别方法是基于轮廓的步态识别方法,然而轮廓容易受到遮挡的影响,从而导致识别准确率下降。在现实的监控场景下,遮挡几乎是不可避免的,提高遮挡情况下的步态识别精度是算法能够“落地”于实际应用的前提。针对此问题,提出了结合轮廓与姿态的时空融合步态识别方
3、法。利用姿态具有抵抗遮挡的能力,设计多模态空间特征融合模块,利用特征重用策略和模态融合策略以提高空间特征的信息容量;设计多尺度时间特征提取模块,利用独立分支提取不同时间尺度下的时间信息,提出一种基于注意力的特征融合策略以自适应地整合时间信息;设计空间特征集合分支,以深监督方式提高时空特征的表达能力。在公开数据集上的实验结果表明了所提方法的有效性,模型在遮挡情况下具有较好的鲁棒性。关键词:步态识别;抵抗遮挡;多模态;多尺度;注意力文献标志码:A中图分类号:TP391.4doi:10.3778/j.issn.1002-8331.2204-0500Spatio-Temporal Fusion Gai
4、t Recognition Method Combining Silhouette and PoseZHANG Chaoyue,ZHANG RongFaculty of Electrical Engineering and Computer Science,Ningbo University,Ningbo,Zhejiang 315211,ChinaAbstract:Most of the existing gait recognition methods are contour-based gait recognition methods,however,contoursare easily
5、affected by occlusion,resulting in a decrease in recognition accuracy.In real monitoring scenarios,occlusion isalmost inevitable,and improving the accuracy of gait recognition under occlusion is the premise that the algorithm canland in practical applications.Aiming at this problem,a spatio-temporal
6、 fusion gait recognition method combining silhou-ette and pose is proposed.Using the ability of pose to resist occlusion,a multi-modality spatial feature fusion module isdesigned,and the feature reuse strategy and modal fusion strategy are used to improve the information capacity of spatialfeatures.
7、A multi-scale temporal feature extraction module is designed to extract temporal information at different timescales using independent branches,and an attention-based feature fusion strategy is proposed to integrate temporal infor-mation adaptively.A spatial feature set branch is designed to improve
8、 the representation of spatial-temporal features in adeeply supervised manner.Experimental results on publicly available datasets show the effectiveness of the proposedmethod,and the model has good robustness under occlusion.Key words:gait recognition;occlusion resistance;multi-modality;multi-scale;
9、attention基金项目:浙江省公益性技术研究项目(LGF21F020008);浙江大学CAD&CG国家重点实验室开放基金项目(A2119)。作者简介:张超越(1997),男,硕士,CCF会员,主要研究方向为模式识别、计算机视觉,E-mail:;张荣(1974),博士,副教授,CCF会员,主要研究方向为数字图像取证、计算机视觉和医学图像分析等。收稿日期:2022-04-28修回日期:2022-08-11文章编号:1002-8331(2023)16-0135-08Computer Engineering and Applications计算机工程与应用135Computer Engin
10、eering and Applications计算机工程与应用2023,59(16)short-term memory)网络从原始RGB视频中提取步态特征。Chao等1提出基于深度集合的步态识别方法GaitSet,利用卷积网络直接从原始步态轮廓中提取空间特征,然后再采用时间轴上的压缩操作对空间特征进行深度集合。Fan等2提出了基于部件的步态识别方法GaitPart,从时空角度提高步态识别精度,首先利用焦点卷积从单幅图像中提取细粒度的空间信息,然后将人体水平划分成不同部件,最后利用微动作捕捉模块从每个部件中提取并聚合短时间的步态信息。在CASIA-B数据集上,这些方法在无遮挡情况下取得了优异的表
11、现,但在遮挡情况下,准确性都急剧下降。由于轮廓对遮挡十分敏感,有学者利用对遮挡不敏感的人体关节点来进行步态识别。例如,Liao等8提出PTSN(pose-based temporal-spatial network)模型,首先利用2D姿态估计技术提取人体的关节点坐标,然后利用LSTM网络和CNN网络分别提取时间特征和空间特征。在遮挡情况下,姿态热图较为准确地反映人体关节点位置,而轮廓不能准确反映行人的身体状态,在遮挡情况下关节点比轮廓更为准确8-9。由于关节点缺少对人体外形的描述,同时受到姿态估计算法准确度的影响,相比于基于轮廓的步态识别方法,基于关节点的步态识别方法的识别精度较低。为提高模型
12、抵抗遮挡的能力,本文提出一种结合轮廓与姿态的时空融合步态识别方法。结合轮廓与姿态的时空融合步态识别方法从时间和空间两方面增强步态特征的表达能力。总体来说,本文的贡献可以总结为以下三点:(1)在空间特征提取方面,设计多模态空间特征融合模块。提出一种特征重用策略增强网络对单模态图像的特征提取能力,提出一种模态融合策略促进多模态信息的融合,提升空间特征的表达能力。(2)在时间特征提取方面,设计多尺度时间特征提取模块。利用独立的时间特征提取分支来提取隐藏在不同时间尺度的行人运动规律,提出一种基于注意力的特征融合策略自适应地整合行人的运动规律,提升时间特征的表达能力。为了保证时空特征的准确性,设计一个空
13、间特征集合分支以监督网络训练。(3)在公开CASIA-B数据集10上的结果表明,本文模型在无遮挡和遮挡情况下的识别精度都超过了现有方法 GaitPart和 GLN。同时在更具有挑战性的 GREW数据集11上,模型具有明显的识别优势。1本文方法1.1轮廓图与姿态热图预处理人体的关节点从原始图像中获得,定位了人体关节点的位置,将包含人体关节点的图像称作姿态热图。对于姿态热图的获取与处理,本文使用预先训练过的卷积姿态机(convolutional pose machine,CPM)12来获得二维姿态热图。CPM构建了一个多级的级联卷积网络,以RGB图像为输入,生成17张图像,其中包括16张关节置信度
14、图像和1幅背景图像,关节置信度图像上估计了人体16个关节点的坐标。本文只选择其中14个关节点的置信度图像,分别为上颈部、头顶、左肩膀、右肩膀、左肘部、右肘部、左手腕、右手腕、左臀部、右臀部、左膝盖、右膝盖、左脚踝、右脚踝。然后,将这14张置信度图像相加,得到一幅完整的姿态热图。一幅姿态热图显示了人体中所有的关节点位置,每个像素上的值代表关节点的估计值,值越大,关节点处于这个位置的概率越大。为使姿态热图与轮廓图在空间上保持对齐,本文利用Takemura等13提出的方法分别对姿态热图和轮廓图进行处理,并将姿态热图和轮廓图的图像大小调整为6444,处理后的图像如图1所示。其中第一行是处理后的轮廓图,
15、第二行为处理后的姿态热图。1.2遮挡对轮廓和关节点的影响分析在监控场景下,遮挡是不可避免的,但是遮挡对轮廓和关节点的影响不同,为了展示遮挡对轮廓和关节点的影响,图1展示了在服装遮挡情况下轮廓和姿态的变化。图中第一行图像为轮廓图,展示了身体的外部形状,第二行图像为姿态热图,显示了人体内部关节点的位置。图中左侧两列为正常情况下行人的步态轮廓图和姿态热图,右侧两列为同一行人穿着外套情况下的步态轮廓图和姿态热图。如图1中第一行轮廓图所示,服装导致人体轮廓出现明显的变化,如第二行姿态热图所示,在服装导致的遮挡情况下,姿态热图的变化较小。与轮廓图相比,姿态热图在遮挡情况下更加鲁棒,不易受到遮挡的影响。图1
16、最后两张图中,轮廓受到衣服遮挡,身体上半部分不再准确,因此不能获得步态特征。而关节点的存在恰好补充轮廓图中遮挡区域缺失的空间信息,因此关节点和轮廓具有互补功能。此外,轮廓的变化过程和姿态的变化过程如图2所示。图2展示的是同一行人在穿外套情况下的轮廓图和姿态热图。轮廓和姿态的连续变化均能体现出人体运动的变化规律,从视觉的角度看,姿态热图和轮廓图是对同一行人的两种不同的描述,属于不同模态的图像,从时间层面分析,轮廓图从人体外形的角度反映行人步行状态的变化,姿态热图从关节点角度反映行人步行状态的变化,轮廓和关节点从不同方面体现了行人的运动特点,因此姿态和轮廓都可作为步态识别的数据。图1轮廓图和姿态热
17、图Fig.1Silhouettes and pose heatmaps1362023,59(16)1.3算法框架结合轮廓与姿态的时空融合步态识别方法的网络结构主要由多模态空间特征融合模块和多尺度时间特征提取模块构成,采用三元组损失(triplet loss)14训练网络。网络流程如下:首先利用现有的姿态热图生成技术,从原始图像中提取到行人的2D姿态热图。然后多模态空间特征融合模块分别从轮廓图和姿态热图中提取行人的空间特征,在模块内部,两种模态的空间信息被融合成行人的空间特征。最后多尺度时间特征提取模块从行人的空间特征序列中提取行人的时间特征。本文通过这两个模块对图像进行处理,获得了步态的时空特
18、征。结合轮廓与姿态的时空融合步态识别网络的结构如图3所示。在本文网络中,主要使用二维卷积核和三维卷积核混合的卷积神经网络来提取行人的时空特征。多模态空间特征融合模块主要由二维卷积核堆积而成,而多尺度时间特征提取模块主要由三维卷积核堆积而成。因为二维卷积核在提取单帧图像特征上有优势,所以空间特征由二维卷积神经网络提取;因为三维卷积神经网络能有效捕捉行人运动规律,所以时间特征由三维卷积神经网络提取。值得注意的是,本文三维卷积神经网络作用在高层特征上,适当减少模型的参数量,让网络轻量化。1.4多模态空间特征融合模块多模态空间特征融合模块的主体结构如图4所示,模块包含了两个独立分支,图中上面分支为轮廓
19、图特征提取分支,下面分支为姿态热图特征提取分支,两个分支结构相同但是参数独立不共享。图中55、33和11表示二维卷积核的大小;水平切割表示将特征图按水平方向平均切割成16部件的操作;全局池化表示为全局平均池化和全局最大池化,类似的操作也出现在文献1-2中;T表示图像的数量。多模态空间特征融合模块的输入是不同模态的两类图像,分别是轮廓图和姿态热图。模块的流程如下:首先,轮廓图和姿态热图经过双分支的网络结构分别生成不同模态的空间特征;然后,水平切割和全局池化作用在不同模态的空间特征上,得到压缩后的空间特征fsilhouette和fpose,类似操作出现在GaitPart2中;最后,利用模态融合策略
20、融合特征fsilhouette和fpose,得到融合后的空间特征ffusion。设计双分支网络结构的原因为:轮廓图和姿态热图的模态不同,提取的特征表达内容和空间分布不同,轮廓图特征提取分支提取人体的边缘信息,而姿态热图特征提取分支提取人体的内部信息,双分支的网络结构保图2穿外套情况下同一行人的轮廓图和姿态热图Fig.2Silhouettes and pose heatmaps of same pedestrianunder coat-wearing condition多尺度时间特征提取模块多尺度时间特征提取模块多尺度时间特征提取模块多模态空间特征融合模块ffusionn=16T训练三元组损失T
21、T图3时空融合步态识别方法的网络架构Fig.3Network architecture of spatio-temporal fusion gait recognition methodn=16TT模态融合模块池化层55333333连接池化层333311池化层55333333连接池化层333311水平切割与全局池化fsilhouettefposeffusionT11卷积图4多模态空间特征融合模块结构Fig.4Multi-modality spatial feature fusion module structure张超越,等:结合轮廓与姿态的时空融合步态识别方法137Computer Engi
22、neering and Applications计算机工程与应用2023,59(16)证了不同模态空间特征的独立性。步态轮廓图为黑白图像,相比于RGB图像,轮廓图中携带的信息量较少,因此充分利用获得的信息是十分重要的。网络浅层得到的几何信息与网络深层得到的语义信息在识别中具有相互补充的作用。为了融合网络浅层和深层的空间信息,提升空间特征携带信息的容量,在网络中设计使用特征重用15策略,特征重用的具体操作为:将第一个池化层后的特征与第四个卷积核后的特征进行通道维度上的特征拼接,然后利用11大小的二维卷积核进行融合压缩。特征重用策略的设计使用提高了单分支网络提取空间特征的能力,实验证明在第2.3.
23、2小节。轮廓和关节点分别表示了人体边缘和内部的信息,因此不同模态的信息具有互补作用。为了融合多模态的信息,本文设计了模态融合模块,主要利用11大小的二维卷积核来实现不同模态特征的信息交互。模态融合模块的具体操作为:fsilhouette和fpose按部件进行特征拼接,拼接后的特征经过11卷积核融合得到空间特征ffusion。值得注意的是,特征拼接作用在通道维度,且每个部件分别使用参数独立的11卷积核进行特征融合。融合过程如式(1)所示:ffusion=conv1()concatfsilhouttefpose(1)其中,conv1表示11大小的卷积核,concat表示通道维度的特征拼接。多模态空
24、间特征融合模块主要处理单帧图像上的空间特征提取问题,而多尺度时间特征提取模块主要处理图像序列上的时间特征提取问题。步态序列中的图像经过多模态空间特征融合模块得到空间特征序列,多尺度时间特征提取模块对空间特征序列进行时间建模。1.5多尺度时间特征提取模块人类可以通过自适应地关注不同时间尺度的时间序列对人进行识别,受此启发,本文设计了多尺度时间特征提取模块,从三个尺度的时间段中获得可判别的运动信息。同时,设计基于注意力的特征融合策略一方面自适应地增强更重要的尺度,抑制不太重要的尺度,另一方面对不同尺度的运动信息进行融合,以提高特征描述行人运动规律的能力。多尺度时间特征提取模块结构如图5所示。图中x
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 结合 轮廓 姿态 时空 融合 步态 识别 方法
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。