基于无锚的轻量化孪生网络目标跟踪算法.pdf
《基于无锚的轻量化孪生网络目标跟踪算法.pdf》由会员分享,可在线阅读,更多相关《基于无锚的轻量化孪生网络目标跟踪算法.pdf(9页珍藏版)》请在咨信网上搜索。
1、 第6 1卷 第4期吉 林 大 学 学 报(理 学 版)V o l.6 1 N o.4 2 0 2 3年7月J o u r n a l o f J i l i nU n i v e r s i t y(S c i e n c eE d i t i o n)J u l y 2 0 2 3d o i:1 0.1 3 4 1 3/j.c n k i.j d x b l x b.2 0 2 2 3 3 5基于无锚的轻量化孪生网络目标跟踪算法丁贵鹏1,陶 钢1,庞春桥1,王小峰1,段桂茹2(1.南京理工大学 能源与动力工程学院,南京2 1 0 0 9 4;2.陆军装备部驻吉林地区军事代表室,吉林 吉林1
2、 3 2 0 0 0)摘要:针对运算资源受限条件下难以实现高精度、高帧率跟踪的问题,提出一种基于无锚的轻量化孪生网络目标跟踪算法.首先使用修改的轻量级网络M o b i l e N e t V 3作为主干网络提取特征,在保持深度特征表达能力的同时减小网络的参数量和计算量;然后对传统互相关操作,提出图级联优化的深度互相关模块,通过丰富特征响应图突出目标特征重要信息;最后在无锚分类回归预测网络中,采用特征共享方式减少参数量和计算量以提升跟踪速度.在两个主流数据集OT B 2 0 1 5和VOT 2 0 1 8上 进 行 对 比 实 验,实 验 结 果 表 明,该 算 法 相 比 于S i a m
3、F C跟踪器有较大的精度优势,并且在复杂跟踪场景下更具鲁棒性,同时跟踪帧率可达1 7 5帧/s.关键词:目标跟踪;孪生网络;轻量级网络M o b i l e N e t V 3;互相关模块;无锚中图分类号:T P 3 9 1 文献标志码:A 文章编号:1 6 7 1-5 4 8 9(2 0 2 3)0 4-0 8 9 0-0 9L i g h t w e i g h t S i a m e s eN e t w o r kT a r g e tT r a c k i n gA l g o r i t h mB a s e do nA n a n c h o rF r e eD I NGG u
4、i p e n g1,T AOG a n g1,P ANGC h u n q i a o1,WANGX i a o f e n g1,DUANG u i r u2(1.S c h o o l o fE n e r g ya n dP o w e rE n g i n e e r i n g,N a n j i n gU n i v e r s i t yo fS c i e n c ea n dT e c h n o l o g y,N a n j i n g2 1 0 0 9 4,C h i n a;2.M i l i t a r yR e p r e s e n t a t i v eO
5、f f i c e i nJ i l i nR e g i o n,A r m yG e n e r a lA r m a m e n tD e p a r t m e n t,J i l i n1 3 2 0 0 0,J i l i nP r o v i n c e,C h i n a)收稿日期:2 0 2 2-0 8-0 7.第一作者简介:丁贵鹏(1 9 8 2),男,汉族,博士研究生,从事视觉观瞄系统设计的研究,E-m a i l:d i n g g u i p e n g1 6 3.c o m.通信作者简介:陶 钢(1 9 6 2),男,汉族,研究员,从事火炮设计与研发的研究,E-m
6、a i l:t a o g a n g n j u s t.e d u.c n.基金项目:国家自然科学基金天文联合基金项目(批准号:U 1 7 3 1 2 4 0).A b s t r a c t:A i m i n ga tt h ep r o b l e mt h a t i tw a sd i f f i c u l tt oa c h i e v eh i g h-p r e c i s i o na n dh i g hf r a m er a t et r a c k i n gu n d e rl i m i t e dc o m p u t i n gr e s o u r c
7、 e s,w ep r o p o s e dal i g h t w e i g h ts i a m e s en e t w o r kt a r g e tt r a c k i n ga l g o r i t h mb a s e do na n a n c h o rf r e e.F i r s t l y,t h em o d i f i e dl i g h t w e i g h tn e t w o r k M o b i l e N e t V 3w a su s e da s t h eb a c k b o n en e t w o r k t oe x t r
8、a c t f e a t u r e s,a n d r e d u c e dp a r a m e t e r s a n dc o m p u t a t i o no f t h en e t w o r k w h i l e m a i n t a i n i n g d e e pf e a t u r e e x p r e s s i o n c a p a b i l i t y.S e c o n d l y,f o rt r a d i t i o n a lc r o s s-c o r r e l a t i o no p e r a t i o n,w ep r
9、 o p o s e dd e e pc r o s s-c o r r e l a t i o n m o d u l ef o rg r a p hc a s c a d i n go p t i m i z a t i o n,w h i c hh i g h l i g h t e di m p o r t a n ti n f o r m a t i o no ft a r g e tf e a t u r e st h r o u g hr i c hf e a t u r er e s p o n s eg r a p h s.F i n a l l y,f e a t u r
10、es h a r i n gw a su s e dt or e d u c ep a r a m e t e r sa n dc o m p u t a t i o nt o i m p r o v e t r a c k i n gs p e e d i nt h ea n c h o rc l a s s i f i c a t i o nr e g r e s s i o np r e d i c t i o nn e t w o r k.C o m p a r a t i v ee x p e r i m e n t sw e r ec o n d u c t e do nt w o
11、m a i n s t r e a md a t a s e t sOT B 2 0 1 5a n dVOT 2 0 1 8,t h ee x p e r i m e n t a l r e s u l t ss h o wt h a t t h ea l g o r i t h mh a sas i g n i f i c a n ta c c u r a c ya d v a n t a g e sc o m p a r e dt oS i a m F Ct r a c k e r,a n di sm o r er o b u s ti nc o m p l e xt r a c k i
12、n gs c e n e s.A t t h es a m e t i m e,t h e t r a c k i n gf r a m er a t ec a nr e a c h1 7 5f r a m e s/s.K e y w o r d s:t a r g e tt r a c k i n g;s i a m e s en e t w o r k;l i g h t w e i g h tn e t w o r k M o b i l e N e t V 3;c r o s s-c o r r e l a t i o nm o d u l e;a n c h o r f r e e目
13、标跟踪在智能安防、自动驾驶等领域应用广泛1.近年来,随着技术理论与硬件资源的发展,目标跟踪在跟踪准确性和鲁棒性方面取得了巨大成功,但由于在实际应用场景中计算机硬件运算资源通常受限,视觉跟踪在跟踪速度方面仍存在很大的局限性.因此,设计一种平衡速度与精度的跟踪器具有重要意义.目前,目标跟踪领域研究的重点大多数为如何进一步提升跟踪准确率,导致跟踪算法使用的网络结构越来越复杂,需要的计算资源越来越多.而目标跟踪应用场景是针对视频序列,速度是跟踪的一个重要指标,不能实现实时跟踪的算法在目标跟踪领域毫无意义.因此,本文在S i a m F C2基础上,提出一种基于无锚的轻量级孪生网络目标跟踪算法,以在计算
14、资源受限环境下更好地平衡跟踪精度与速度.针对现有S i a m F C网络结构,修改轻量级网络M o b i l e N e t V 33作为主干网络,使提取的特征更适合于跟踪任务,进一步调整网络结构.提出级联优化的深度互相关模块,丰富特征响应图,突出目标特征重要信息,强化对跟踪有利的特征.对于无锚分类回归预测网络,采用特征共享方式减少参数量和计算量以提升跟踪速度.1 相关工作目标跟踪目前主要分为相关滤波类和深度学习类两大分支.相关滤波类跟踪算法主要采用梯度直方图特征、颜色特征等手工特征设计跟踪器,算法推理时间快,以K C F4和f D S S T5等为代表.但由于手工设计的浅层特征较简单,在
15、应对目标跟踪过程中的复杂挑战时,稳定性较差.由于深度特征具有更强的表达能力,因此深度学习类跟踪算法在跟踪精度方面成果显著.但以MD N e t6为代表的深度网络类跟踪算法的预训练网络异常巨大,为提升跟踪精度需使用大量高维特征,导致跟踪的帧率只有几帧,完全不能满足实际应用场景.近年来,使用深度特征的孪生网络目标跟踪算法受到广泛关注,其在保持对首帧框选目标精准跟踪的同时,还可以实现高速稳定的跟踪.为进一步提升孪生网络跟踪算法的跟踪性能,基于S i a m F C已相继提出了一些更高效的改进算法,如构建训练多个孪生网络分支的MB S T7和使用R e s N e t 5 0作为主干网络的S i a
16、mDW8等.孪生网络目标跟踪算法由两支结构相同权重共享的神经网络构成,如图1所示.其主要思想是将目标跟踪任务转化为相似性度量问题,通过两个相同子网络分别对首帧框选的目标模板和视频后序每图1 孪生网络类目标跟踪算法结构F i g.1 S t r u c t u r eo f s i a m e s en e t w o r kt a r g e t t r a c k i n ga l g o r i t h m一帧的搜索区域进行特征提取,获得模板特征向量和搜索特征向量.然后使用相似度量函数计算两路特征向量的相似性程度,从而确定目标在搜索区域中出现的位置.孪生网络跟踪原理的数学表达式为f(Z,X
17、)=(Z)*(X),(1)其中f(Z,X)表示构造的相似性度量函数,Z是视频序列首帧中框选的目标模板图像,X是视频序列每帧的搜索区域图像,()表示两支结构相同权重共享的神经网络所提取的特征向量,*表示互相关运算.则跟踪过程为将第一帧中选定的目标模板图像和待跟踪搜索图像送入孪生网络中,通过两支结构相同权重共享的主干网络可得到两路特征向量,然后通过互相关运算计算相似程度.即以模版特征向量作为卷积核对搜索特征向量进行卷积,得到得分响应图,特征相应得分数值的大小直接反应目标在该分数位置出现的概率.分值最高的位置即待跟踪目标在这一帧搜索图像中的位置,然后对特征响应图中得分最高的位置进行多尺度变化,从而在
18、原图中确定目标边界框.198 第4期 丁贵鹏,等:基于无锚的轻量化孪生网络目标跟踪算法 2 算法设计算法的整体框架如图2所示.首先,使用两支权值共享的轻量级网络M o b i l e N e t V 3构建成孪生网络分别提取模板图像和搜索图像的深度特征;其次,提出图级联优化的深度互相关模块替代传统互相关操作,通过丰富特征响应图突出目标特征重要信息;最后,对于图级联优化深度互相关模块输出的特征响应图,直接通过分类回归网络以无锚方式估计目标预测框在搜索图像中的位置信息.图2 本文算法结构F i g.2 S t r u c t u r eo fp r o p o s e da l g o r i t
19、 h m2.1 轻量级骨干网络M o b i l e N e t V 3目前在目标跟踪算法中使用孪生网络结构的多采用R e s N e t 5 09作为主干网络提取特征,可显著提升目标跟踪的精度,但也会使网络结构更复杂、增加网络的计算量,导致目标跟踪算法所需的硬件设备在计算资源上要求极高.因此,导致在算力较差的设备上进行跟踪时受到极大限制,每帧所需的时间大幅度提升,从而无法达到实时跟踪的效果.为降低网络的复杂度而采用较简单的A l e x N e t作为主干网络提取特征,确实能在速度上大幅度提升,但由于A l e x N e t的网络层数较少,不能提取到更深层的语义信息,算法的鲁棒性较低.所以
20、综合考虑算法在现实设备算力受限的情况下,达到实时跟踪以及较好的跟踪效果,本文进行了大量的实验进行算法效果对比,最终发现采用M o b i l e N e t V 3作为主干网络可在保持良好跟踪精度的同时所需的计算量最少,适合于算力匮乏的情况.M o b i l e N e t V 3是在M o b i l e N e t V 11 0和M o b i l e N e t V 21 1上进行了优化,保存了M o b i l e N e t V 1经典的深度可分离卷积,并在M o b i l e N e t V 2的具有线性瓶颈的残差结构中引入了S E(s q u e e z e-a n d-e
21、x c i t a t i o n)通道注意力模块,使网络结构更稳定.常用的神经网络参数量对比结果列于表1.表1 常见神经网络参数量对比T a b l e1 C o m p a r i s o no f c o mm o nn e u r a l n e t w o r kp a r a m e t e r s网络模型参数量计算量/M a d d sT o p_1精度/%A l e x N e t6 21 067 2 01 066 3.0R e s N e t2 61 063.51 097 9.0M o b i l e N e t V 14.21 065 7 51 067 0.6M o b i
22、 l e N e t V 23.41 063 0 01 067 2.0M o b i l e N e t V 35.41 062 1 91 067 5.2 注:M a d d s为乘加累积操作,1M a d d s包含1个乘法操作和1个加法操作.298 吉 林 大 学 学 报(理 学 版)第6 1卷 深度可分离卷积主要由深度卷积和点卷积两部分构成.深度卷积的计算过程如图3(A)所示,对于输入特征的各通道分别使用卷积核进行独立的卷积操作,其中每个卷积核大小为DkDk1.点卷积过程如图3(B)所示,对于深度卷积输出的深度特征再进行一次卷积操作,即采用核为11的标准卷积调整特征维度从而获得一个新的特
23、征图.图3 深度可分离卷积F i g.3 D e e ps e p a r a b l ec o n v o l u t i o n假设要将大小为DFDFM的输入特征图通过卷积获得大小为DFDFN的新特征,使用卷积核的大小为Dk,一次标准卷积所需的计算量大小为MA Cc o n v=DFDFMNDkDk.(2)则深度可分离卷积所需计算量为MA CDW c o n v=DFDFMDkDk+MNDFDF.(3)二者计算量比值为=MA CDW c o n vMA Cc o n v=DFDFMDkDk+MNDFDFDFDFMNDkDk=1N+1D2k.(4)M o b i l e N e t V 2中
24、的倒残差模块,可在保证参数量较小的同时获得更丰富的特征信息,但特征图不同通道对不同目标的响应不均衡,可能在所有特征通道中仅有少数通道对所需关注的目标具有较高的响应,此时网络对不同通道提取的特征赋予相同的权重会降低算法的性能.M o b i l e N e t V 3为解决该问题在倒残差结构中引入了S E通道注意力机制,根据特征的重要程度赋予不同的权重,虽然增加了一部分参数量,但对跟踪的时间影响不明显,极大提高了网络对目标关键特征的敏感度.M o b i l e N e t V 3网络采用的总步长为1 6,其最后的输出特征包含更多的类别信息,更适用于对目标类别的区分,但对于本文的跟踪,网络需要输
25、出的特征还需要包含足够多的空间信息,从而有利于确定待跟踪目标的位置,因此保留更多的空间信息极为重要.而网络总的步长会直接影响特征图的输出尺寸及感受野的大小,所以为保留更多的空间特征信息,可适当减小网络步长.如果网络步长过小又会导致特征感受野的增大,进而导致跟踪目标的位置特征丢失明显,跟踪的精度也会极大降低.但感受野如果太小目标尺寸较大时,会导致提取的特征语义不足,使跟踪需要更大的计算负担,极大降低了跟踪效果.大量的对比实验表明,在网络步长为8时,跟踪的精度和速度等指标会更好,所以本文最终采用的步长为8.为保持较好的跟踪效果以及网络推理速度,本文在M o b i l e N e t V 3原网络
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 量化 孪生 网络 目标 跟踪 算法
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。