基于多尺度特征提取的YOLOv5s算法优化_李校林.pdf
《基于多尺度特征提取的YOLOv5s算法优化_李校林.pdf》由会员分享,可在线阅读,更多相关《基于多尺度特征提取的YOLOv5s算法优化_李校林.pdf(9页珍藏版)》请在咨信网上搜索。
1、 基于多尺度特征提取的Y O L O v 5 s算法优化*李校林1,2,王复港1,2,张鹏飞1,2,张琳玉1,2(1.重庆邮电大学通信与信息工程学院,重庆 4 0 0 0 6 5;2.重庆邮电大学通信新技术应用研究中心,重庆 4 0 0 0 6 5)摘 要:目标检测算法广泛应用于无人驾驶、机器人视觉和工业自动化等领域,具有重要研究价值。在众多目标检测算法中,YO L O v 5 s具有参数规模小和检测速度快的优点,但存在检测精度不高的问题。针对YO L O v 5 s标准卷积模块特征提取能力不强且存在特征冗余的问题,提出2个基于多尺度特征提取的卷积模块。首先提出多感受野卷积模块,通过多个尺寸的
2、卷积核获取不同粒度的语义信息,以提高模型特征提取能力;然后提出特征图卷积模块,利用少量标准卷积核与分组卷积减少特征通道间的相互制约,提高特征图的多样性;最后使用多感受野卷积模块和特征图卷积模块替换YO L O v 5 s的部分标准卷积模块,得到本文的改进算法。在P A S C A L VO C数据集上的实验结果表明,改进算法在提高了检测精度的同时还保证了YO L O v 5 s的实时检测能力,mA P_0.5和mA P_0.5:0.9 5分别提高了2.4%和4.9%,证明了改进算法的有效性;在D OT A数据集上进一步验证了改进算法在不同环境下具有良好的泛化能力。关键词:目标检测;多尺度特征;
3、感受野;特征冗余中图分类号:T P 3 9 1.4文献标志码:Ad o i:1 0.3 9 6 9/j.i s s n.1 0 0 7-1 3 0 X.2 0 2 3.0 6.0 1 2Y O L O v 5 s a l g o r i t h m o p t i m i z a t i o n b a s e d o n m u l t i-s c a l e f e a t u r e e x t r a c t i o nL I X i a o-l i n1,2,WANG F u-g a n g1,2,Z HANG P e n g-f e i1,2,Z HANG L i n-y u1,2
4、(1.S c h o o l o f C o mm u n i c a t i o n a n d I n f o r m a t i o n E n g i n e e r i n g,C h o n g q i n g U n i v e r s i t y o f P o s t s a n d T e l e c o mm u n i c a t i o n s,C h o n g q i n g 4 0 0 0 6 5;2.R e s e a r c h C e n t e r o f N e w T e l e c o mm u n i c a t i o n T e c h n
5、o l o g y,C h o n g q i n g U n i v e r s i t y o f P o s t s a n d T e l e c o mm u n i c a t i o n s,C h o n g q i n g 4 0 0 0 6 5,C h i n a)A b s t r a c t:O b j e c t d e t e c t i o n a l g o r i t h m s a r e w i d e l y u s e d i n u n m a n n e d d r i v i n g,r o b o t v i s i o n,i n d u s
6、 t r i a l a u t o m a t i o n a n d o t h e r f i e l d s,a n d h a v e i m p o r t a n t r e s e a r c h v a l u e.Am o n g m a n y t a r g e t d e t e c t i o n a l g o-r i t h m,YO L O v 5 s h a s t h e a d v a n t a g e s o f f a s t d e t e c t i o n s p e e d a n d s m a l l p a r a m e t e r
7、 s c a l e,b u t a l s o h a s t h e p r o b l e m o f l o w d e t e c t i o n a c c u r a c y.A i m i n g a t t h e p r o b l e m t h a t t h e YO L O v 5 s s t a n d a r d c o n v o l u t i o n m o d u l e h a s w e a k f e a t u r e e x t r a c t i o n c a p a b i l i t i e s a n d f e a t u r e
8、r e d u n d a n c y,t w o c o n v o l u t i o n m o d u l e s b a s e d o n m u l t i-s c a l e f e a t u r e e x t r a c t i o n a r e p r o p o s e d.F i r s t l y,a m u l t i-r e c e p t i v e f i e l d c o n v o l u t i o n m o d u l e i s p r o-p o s e d t o i m p r o v e t h e f e a t u r e e
9、x t r a c t i o n a b i l i t y o f t h e m o d e l.I t o b t a i n s s e m a n t i c i n f o r m a t i o n o f d i f f e r e n t g r a n u l a r i t i e s t h r o u g h c o n v o l u t i o n k e r n e l s o f m u l t i p l e s i z e s.S e c o n d l y,a f e a t u r e m a p c o n v o l u t i o n m o
10、d u l e i s p r o p o s e d t o i m p r o v e t h e d i v e r s i t y o f f e a t u r e m a p s.I t u s e s a s m a l l n u m b e r o f s t a n d a r d c o n v o l u t i o n k e r n e l s a n d g r o u p e d c o n v o l u t i o n s t o r e d u c e t h e m u t u a l c o n s t r a i n t s b e t w e e
11、n f e a t u r e c h a n n e l s.F i n a l l y,s o m e s t a n d a r d c o n v o l u t i o n m o d u l e s o f YO L O v 5 s a r e r e p l a c e d b y m u l t i-r e c e p t i v e f i e l d c o n v o l u t i o n m o d-u l e a n d f e a t u r e m a p c o n v o l u t i o n m o d u l e,a n d t h e i m p r
12、 o v e d a l g o r i t h m i n t h i s p a p e r i s o b t a i n e d.T h e e x-p e r i m e n t a l r e s u l t s o n P a s c a l VO C d a t a s e t s h o w t h a t t h e i m p r o v e d a l g o r i t h m n o t o n l y i m p r o v e s t h e d e-*收稿日期:2 0 2 1-1 2-0 2;修回日期:2 0 2 2-0 5-0 1通信作者:王复港(w a n
13、 g f u g a n g 2 11 6 3.c o m)通信地址:4 0 0 0 6 5 重庆市南岸区崇文路2号重庆邮电大学通信与信息工程学院A d d r e s s:S c h o o l o f C o mm u n i c a t i o n a n d I n f o r m a t i o n E n g i n e e r i n g,C h o n g q i n g U n i v e r s i t y o f P o s t s a n d T e l e c o mm u n i c a t i o n s,2 C h o n g-w e n R o a d,N a
14、 na n D i s t r i c t,C h o n g q i n g 4 0 0 0 6 5,P.R.C h i n a C N 4 3-1 2 5 8/T PI S S N 1 0 0 7-1 3 0 X 计算机工程与科学C o m p u t e r E n g i n e e r i n g&S c i e n c e第4 5卷第6期2 0 2 3年6月 V o l.4 5,N o.6,J u n.2 0 2 3 文章编号:1 0 0 7-1 3 0 X(2 0 2 3)0 6-1 0 5 4-0 9t e c t i o n a c c u r a c y,b u t a l
15、 s o m a i n t a i n s t h e r e a l-t i m e d e t e c t i o n a b i l i t y o f YO L O v 5 s.mA P_0.5 a n d mA P_0.5:0.9 5 a r e i n c r e a s e d b y 2.4%a n d 4.9%r e s p e c t i v e l y,w h i c h p r o v e d t h e e f f e c t i v e n e s s o f t h e i m p r o v e d a l g o r i t h m.I t i s f u
16、r t h e r v e r i f i e d o n D OT A d a t a s e t t h a t t h e i m p r o v e d a l g o r i t h m h a s g o o d g e n e r a l i z a t i o n a b i l i t y i n d i f f e r e n t e n v i r o n m e n t s.K e y w o r d s:o b j e c t d e t e c t i o n;m u l t i-s c a l e f e a t u r e;r e c e p t i v e f
17、 i e l d;f e a t u r e r e d u n d a n c y1 引言目标检测是计算机视觉领域的核心任务。近年来,随着算法的创新、算力的提升以及大规模数据集的使用,大量基于卷积神经网络的目标检测算法不断涌现。根据设计原理算法可以分为两阶段目标检测算法(T w o-s t a g e O b j e c t D e t e c t o r)和单阶段目标检测算法(O n e-s t a g e O b j e c t D e t e c t o r)2个类别。以R-C NN(R e g i o n s w i t h C o n v o l u t i o n a l N e
18、 u r a l N e t w o r k)1、F a s t-R C NN(F a s t R e g i o n-b a s e d C o n v o l u t i o n a l N e u r a l N e t w o r k)2和F a s t e r-R C NN(F a s t e r R e g i o n-b a s e d C o n v o l u t i o n-a l N e u r a l N e t w o r k)3为代表的两阶段目标检测算法将目标检测任务看作分类问题,在第1阶段生成多个可能包含待检测目标的候选区域,在第2阶段对候选区域中可能存在的目标进
19、行分类。以S S D(S i n g l e S h o t m u l t i b o x D e t e c t o r)4和YO L O(Y o u O n l y L o o k O n c e)5为代表的单阶段目标检测算法将检测目标边框看作回归问题,直接在卷积神经网络中提取特征,预测目标分类和位置信息。近年来,单阶段目标检测算法凭借检测速度快的优势成为研究的热门,而提高检测精度与检测速度、减少模型参数量与计算开销是其中的重要研究内容。S S D通过使用光学变换与几何变换等数据增强手 段来增强数 据集的丰富 性,使用延 伸的VG GN e t(V i s u a l G e o m e
20、 t r y G r o u p N e t w o r k)6作为骨干网络,生成6个尺寸的特征图来检测不同大小的目标;D S S D(D e c o n v o l u t i o n a l S i n g l e S h o t D e-t e c t o r)7针对S S D算法中浅层特征图语义信息不足的问题,改进传统上采样方法并将深层特征融合到浅层特征图中,增强浅层特征图的语义性,从而提高模型性能;L i n等8认为正负样本不平衡是导致单阶段算法检测精度差的重要原因,提出聚焦于难识别样本的焦点损失F o c a l-L o s s函数,缓解单阶段目标检测算法R e t i n a N
21、 e t中的样本不平衡问题;G I o U(G e n e r a l i z e d I n t e r s e c t i o n o v e r U n i o n)9和D I o U(D i s t a n c e I n t e r s e c t i o n o v e r U n i o n)1 0等通过改进边界回归损失函数在一定程度上克服了I o U损 失 函 数 收 敛 慢 和 回 归 不 准 确 的 问 题;YO L O v 21 1、YO L O v 3 1 2和YO L O v 4 1 3 等算法通过改进数据增强技术、设计新的骨干网络、借鉴残差网络结构和吸收其他先进模型
22、的优秀思想等方式不断改进,逐渐成为准确性与实时性兼备的目标检测方法,并在工业界和学术界获得广泛认可。P o l y-YO L O1 4通过聚合轻量型S E-D a r k N e t-5 3骨干网络、使用阶梯上采样方法并生成具有高分辨率的 单 尺 度 输 出 特 征 图,在 一 定 程 度 上 克 服 了YO L O v 3的标签大量重写和锚点分布低效的问题。L i u等1 5基于YO L O v 4进行结构调整,利用D a r k N e t强化前后层信息交流的思想,将骨干网络的残差模块替换为密集连接模块(D e n s e B l o c k),从而更好地提取特征并且在交通标志检测中达到了
23、较高的检测精度。Z h u等1 6通过改进检测头、添加检测特征图以及整合卷积注意力模块等方法提高了目标检测算法T P H-YO L O v 5应对目标尺寸变化以及运动模糊等问题的能力,并在无人机视觉挑战赛中取得优秀成绩。在经典的YO L O系列算法不断发展的同时,其他目标检测算法也纷纷涌现。YO L O-X1 7是YO L O v 3的改进版本,使用解耦的检测头、先进的标签分配策略以及无锚框机制在检测速度与检测精度之 间 实 现 了 很 好 的 权 衡;YO L O-F设 计 人员1 8提出扩展编码器与统一匹配2个关键组件,在检测速度提高2.5倍的同时取得了与R e t i n a N e t
24、相似的检测精度;随着注意力机制的广泛应用,D E T R(D E t e c t i o n T R a n s f o r m e r)1 9和V i s i o n T r a n s f o r m e r2 0的设计人员将在自然语言处理领域取得巨大影响力的T r a n s f o r m e r成功应用于计算机视觉任务中,S MC A(S p a t i a l l y M o d u l a t e d C o-A t t e n t i o n)2 1设计人员使用空间调制的协同注意力机制加快D E T R的收敛速度;在视觉任务中取得良好检测效果的S q u e e z e N e
25、 t2 2、M o b i l e N e t2 3、S h u f f l e N e t2 4和M i c r o N e t2 5等为目标检测任务提供了轻量化的骨干网络。虽然以上方法在检测精度与检测速度方面均有提高,但是并未解决轻量化模型检测精度差的问题。YO L O v 5系列目标检测算法通过控制参数规5501李校林等:基于多尺度特征提取的YO L O v 5 s算法优化模生成4个子算法,其中YO L O v 5 s检测速度最快、参 数 量 最 少,但 是 相 比 于YO L O v 5 m、YO L O v 5 l和YO L O v 5 x,其检测精度较差。因此,本文针对YO L O
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 尺度 特征 提取 YOLOv5s 算法 优化 李校林
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。