分销赏收藏举报申诉 / 9

立即下载开通VIP

当前位置：首页 > 学术论文 > 毕业论文/毕业设计 > 基于多尺度特征提取的YOLOv5s算法优化_李校林.pdf

基于多尺度特征提取的YOLOv5s算法优化_李校林.pdf

上传人：自信****多点

文档编号：277435

上传时间：2023-06-26

格式：PDF

页数：9

大小：1.21MB

《基于多尺度特征提取的YOLOv5s算法优化_李校林.pdf》由会员分享，可在线阅读，更多相关《基于多尺度特征提取的YOLOv5s算法优化_李校林.pdf（9页珍藏版）》请在咨信网上搜索。

1、基于多尺度特征提取的Y O L O v 5 s算法优化*李校林1,2,王复港1,2,张鹏飞1,2,张琳玉1,2(1.重庆邮电大学通信与信息工程学院,重庆 4 0 0 0 6 5;2.重庆邮电大学通信新技术应用研究中心,重庆 4 0 0 0 6 5)摘要:目标检测算法广泛应用于无人驾驶、机器人视觉和工业自动化等领域,具有重要研究价值。在众多目标检测算法中,YO L O v 5 s具有参数规模小和检测速度快的优点,但存在检测精度不高的问题。针对YO L O v 5 s标准卷积模块特征提取能力不强且存在特征冗余的问题,提出2个基于多尺度特征提取的卷积模块。首先提出多感受野卷积模块,通过多个尺寸的

2、卷积核获取不同粒度的语义信息,以提高模型特征提取能力;然后提出特征图卷积模块,利用少量标准卷积核与分组卷积减少特征通道间的相互制约,提高特征图的多样性;最后使用多感受野卷积模块和特征图卷积模块替换YO L O v 5 s的部分标准卷积模块,得到本文的改进算法。在P A S C A L VO C数据集上的实验结果表明,改进算法在提高了检测精度的同时还保证了YO L O v 5 s的实时检测能力,mA P_0.5和mA P_0.5:0.9 5分别提高了2.4%和4.9%,证明了改进算法的有效性;在D OT A数据集上进一步验证了改进算法在不同环境下具有良好的泛化能力。关键词:目标检测;多尺度特征;

3、感受野;特征冗余中图分类号:T P 3 9 1.4文献标志码:Ad o i:1 0.3 9 6 9/j.i s s n.1 0 0 7-1 3 0 X.2 0 2 3.0 6.0 1 2Y O L O v 5 s a l g o r i t h m o p t i m i z a t i o n b a s e d o n m u l t i-s c a l e f e a t u r e e x t r a c t i o nL I X i a o-l i n1,2,WANG F u-g a n g1,2,Z HANG P e n g-f e i1,2,Z HANG L i n-y u1,2

4、(1.S c h o o l o f C o mm u n i c a t i o n a n d I n f o r m a t i o n E n g i n e e r i n g,C h o n g q i n g U n i v e r s i t y o f P o s t s a n d T e l e c o mm u n i c a t i o n s,C h o n g q i n g 4 0 0 0 6 5;2.R e s e a r c h C e n t e r o f N e w T e l e c o mm u n i c a t i o n T e c h n

5、o l o g y,C h o n g q i n g U n i v e r s i t y o f P o s t s a n d T e l e c o mm u n i c a t i o n s,C h o n g q i n g 4 0 0 0 6 5,C h i n a)A b s t r a c t:O b j e c t d e t e c t i o n a l g o r i t h m s a r e w i d e l y u s e d i n u n m a n n e d d r i v i n g,r o b o t v i s i o n,i n d u s

6、 t r i a l a u t o m a t i o n a n d o t h e r f i e l d s,a n d h a v e i m p o r t a n t r e s e a r c h v a l u e.Am o n g m a n y t a r g e t d e t e c t i o n a l g o-r i t h m,YO L O v 5 s h a s t h e a d v a n t a g e s o f f a s t d e t e c t i o n s p e e d a n d s m a l l p a r a m e t e r

7、 s c a l e,b u t a l s o h a s t h e p r o b l e m o f l o w d e t e c t i o n a c c u r a c y.A i m i n g a t t h e p r o b l e m t h a t t h e YO L O v 5 s s t a n d a r d c o n v o l u t i o n m o d u l e h a s w e a k f e a t u r e e x t r a c t i o n c a p a b i l i t i e s a n d f e a t u r e

8、r e d u n d a n c y,t w o c o n v o l u t i o n m o d u l e s b a s e d o n m u l t i-s c a l e f e a t u r e e x t r a c t i o n a r e p r o p o s e d.F i r s t l y,a m u l t i-r e c e p t i v e f i e l d c o n v o l u t i o n m o d u l e i s p r o-p o s e d t o i m p r o v e t h e f e a t u r e e

9、x t r a c t i o n a b i l i t y o f t h e m o d e l.I t o b t a i n s s e m a n t i c i n f o r m a t i o n o f d i f f e r e n t g r a n u l a r i t i e s t h r o u g h c o n v o l u t i o n k e r n e l s o f m u l t i p l e s i z e s.S e c o n d l y,a f e a t u r e m a p c o n v o l u t i o n m o

10、d u l e i s p r o p o s e d t o i m p r o v e t h e d i v e r s i t y o f f e a t u r e m a p s.I t u s e s a s m a l l n u m b e r o f s t a n d a r d c o n v o l u t i o n k e r n e l s a n d g r o u p e d c o n v o l u t i o n s t o r e d u c e t h e m u t u a l c o n s t r a i n t s b e t w e e

11、n f e a t u r e c h a n n e l s.F i n a l l y,s o m e s t a n d a r d c o n v o l u t i o n m o d u l e s o f YO L O v 5 s a r e r e p l a c e d b y m u l t i-r e c e p t i v e f i e l d c o n v o l u t i o n m o d-u l e a n d f e a t u r e m a p c o n v o l u t i o n m o d u l e,a n d t h e i m p r

12、 o v e d a l g o r i t h m i n t h i s p a p e r i s o b t a i n e d.T h e e x-p e r i m e n t a l r e s u l t s o n P a s c a l VO C d a t a s e t s h o w t h a t t h e i m p r o v e d a l g o r i t h m n o t o n l y i m p r o v e s t h e d e-*收稿日期:2 0 2 1-1 2-0 2;修回日期:2 0 2 2-0 5-0 1通信作者:王复港(w a n

13、 g f u g a n g 2 11 6 3.c o m)通信地址:4 0 0 0 6 5 重庆市南岸区崇文路2号重庆邮电大学通信与信息工程学院A d d r e s s:S c h o o l o f C o mm u n i c a t i o n a n d I n f o r m a t i o n E n g i n e e r i n g,C h o n g q i n g U n i v e r s i t y o f P o s t s a n d T e l e c o mm u n i c a t i o n s,2 C h o n g-w e n R o a d,N a

14、 na n D i s t r i c t,C h o n g q i n g 4 0 0 0 6 5,P.R.C h i n a C N 4 3-1 2 5 8/T PI S S N 1 0 0 7-1 3 0 X 计算机工程与科学C o m p u t e r E n g i n e e r i n g&S c i e n c e第4 5卷第6期2 0 2 3年6月 V o l.4 5,N o.6,J u n.2 0 2 3 文章编号:1 0 0 7-1 3 0 X(2 0 2 3)0 6-1 0 5 4-0 9t e c t i o n a c c u r a c y,b u t a l

15、 s o m a i n t a i n s t h e r e a l-t i m e d e t e c t i o n a b i l i t y o f YO L O v 5 s.mA P_0.5 a n d mA P_0.5:0.9 5 a r e i n c r e a s e d b y 2.4%a n d 4.9%r e s p e c t i v e l y,w h i c h p r o v e d t h e e f f e c t i v e n e s s o f t h e i m p r o v e d a l g o r i t h m.I t i s f u

16、r t h e r v e r i f i e d o n D OT A d a t a s e t t h a t t h e i m p r o v e d a l g o r i t h m h a s g o o d g e n e r a l i z a t i o n a b i l i t y i n d i f f e r e n t e n v i r o n m e n t s.K e y w o r d s:o b j e c t d e t e c t i o n;m u l t i-s c a l e f e a t u r e;r e c e p t i v e f

17、 i e l d;f e a t u r e r e d u n d a n c y1 引言目标检测是计算机视觉领域的核心任务。近年来,随着算法的创新、算力的提升以及大规模数据集的使用,大量基于卷积神经网络的目标检测算法不断涌现。根据设计原理算法可以分为两阶段目标检测算法(T w o-s t a g e O b j e c t D e t e c t o r)和单阶段目标检测算法(O n e-s t a g e O b j e c t D e t e c t o r)2个类别。以R-C NN(R e g i o n s w i t h C o n v o l u t i o n a l N e

18、 u r a l N e t w o r k)1、F a s t-R C NN(F a s t R e g i o n-b a s e d C o n v o l u t i o n a l N e u r a l N e t w o r k)2和F a s t e r-R C NN(F a s t e r R e g i o n-b a s e d C o n v o l u t i o n-a l N e u r a l N e t w o r k)3为代表的两阶段目标检测算法将目标检测任务看作分类问题,在第1阶段生成多个可能包含待检测目标的候选区域,在第2阶段对候选区域中可能存在的目标进

19、行分类。以S S D(S i n g l e S h o t m u l t i b o x D e t e c t o r)4和YO L O(Y o u O n l y L o o k O n c e)5为代表的单阶段目标检测算法将检测目标边框看作回归问题,直接在卷积神经网络中提取特征,预测目标分类和位置信息。近年来,单阶段目标检测算法凭借检测速度快的优势成为研究的热门,而提高检测精度与检测速度、减少模型参数量与计算开销是其中的重要研究内容。S S D通过使用光学变换与几何变换等数据增强手段来增强数据集的丰富性,使用延伸的VG GN e t(V i s u a l G e o m e

20、 t r y G r o u p N e t w o r k)6作为骨干网络,生成6个尺寸的特征图来检测不同大小的目标;D S S D(D e c o n v o l u t i o n a l S i n g l e S h o t D e-t e c t o r)7针对S S D算法中浅层特征图语义信息不足的问题,改进传统上采样方法并将深层特征融合到浅层特征图中,增强浅层特征图的语义性,从而提高模型性能;L i n等8认为正负样本不平衡是导致单阶段算法检测精度差的重要原因,提出聚焦于难识别样本的焦点损失F o c a l-L o s s函数,缓解单阶段目标检测算法R e t i n a N

21、 e t中的样本不平衡问题;G I o U(G e n e r a l i z e d I n t e r s e c t i o n o v e r U n i o n)9和D I o U(D i s t a n c e I n t e r s e c t i o n o v e r U n i o n)1 0等通过改进边界回归损失函数在一定程度上克服了I o U损失函数收敛慢和回归不准确的问题;YO L O v 21 1、YO L O v 3 1 2和YO L O v 4 1 3 等算法通过改进数据增强技术、设计新的骨干网络、借鉴残差网络结构和吸收其他先进模型

22、的优秀思想等方式不断改进,逐渐成为准确性与实时性兼备的目标检测方法,并在工业界和学术界获得广泛认可。P o l y-YO L O1 4通过聚合轻量型S E-D a r k N e t-5 3骨干网络、使用阶梯上采样方法并生成具有高分辨率的单尺度输出特征图,在一定程度上克服了YO L O v 3的标签大量重写和锚点分布低效的问题。L i u等1 5基于YO L O v 4进行结构调整,利用D a r k N e t强化前后层信息交流的思想,将骨干网络的残差模块替换为密集连接模块(D e n s e B l o c k),从而更好地提取特征并且在交通标志检测中达到了

23、较高的检测精度。Z h u等1 6通过改进检测头、添加检测特征图以及整合卷积注意力模块等方法提高了目标检测算法T P H-YO L O v 5应对目标尺寸变化以及运动模糊等问题的能力,并在无人机视觉挑战赛中取得优秀成绩。在经典的YO L O系列算法不断发展的同时,其他目标检测算法也纷纷涌现。YO L O-X1 7是YO L O v 3的改进版本,使用解耦的检测头、先进的标签分配策略以及无锚框机制在检测速度与检测精度之间实现了很好的权衡;YO L O-F设计人员1 8提出扩展编码器与统一匹配2个关键组件,在检测速度提高2.5倍的同时取得了与R e t i n a N e t

24、相似的检测精度;随着注意力机制的广泛应用,D E T R(D E t e c t i o n T R a n s f o r m e r)1 9和V i s i o n T r a n s f o r m e r2 0的设计人员将在自然语言处理领域取得巨大影响力的T r a n s f o r m e r成功应用于计算机视觉任务中,S MC A(S p a t i a l l y M o d u l a t e d C o-A t t e n t i o n)2 1设计人员使用空间调制的协同注意力机制加快D E T R的收敛速度;在视觉任务中取得良好检测效果的S q u e e z e N e

25、 t2 2、M o b i l e N e t2 3、S h u f f l e N e t2 4和M i c r o N e t2 5等为目标检测任务提供了轻量化的骨干网络。虽然以上方法在检测精度与检测速度方面均有提高,但是并未解决轻量化模型检测精度差的问题。YO L O v 5系列目标检测算法通过控制参数规5501李校林等:基于多尺度特征提取的YO L O v 5 s算法优化模生成4个子算法,其中YO L O v 5 s检测速度最快、参数量最少,但是相比于YO L O v 5 m、YO L O v 5 l和YO L O v 5 x,其检测精度较差。因此,本文针对YO L O

26、 v 5 s存在的不足进行优化,基于多尺度特征提取的思想提出了多感受野卷积模块和特征图卷积模块,通过提高特征提取能力和减少特征图冗余的方法对YO L O v 5 s进行改进,得到本文的改进算法。使用提出的模块替换原始模型中的标准卷积模块,实验结果表明,改进算法在P A S-C A L VO C(P A S C A L V i s u a l O b j e c t C l a s s e s)数据集和D OT A(D a t a s e t f o r O b j e c t d e T e c t i o n i n A e r-i a l i m a g e s)数据集上取得了比YO L

27、O v 5 s更高的检测精度,且对小目标、形变以及遮挡等情况具有更好的鲁棒性。2 Y O L O v 5 s目标检测算法本节对YO L O v 5 s目标检测算法及其各模块进行简要介绍。YO L O v 5 s算法的网络结构可以分为骨干(B a c k B o n e)、颈部(N e c k)和检测头(H e a d)共3个部分,如图1所示。F i g u r e 1 N e t w o r k s t r u c t u r e o f YO L O v 5 s图1 YO L O v 5 s网络结构(1)B a c k B o n e。首先切片下采样模块对输入图像进行切片处理,

28、在空间维度将输入图像等分为4个相同大小的子图;然后在通道维度拼接4幅子图,从而在不丢失图像信息的同时实现二倍下采样,YO L O v 5 s将该切片下采样模块命名为F o c u s。卷积层(C o n v o l u t i o n L a y e r)、批归一化层(B a t c h N o r m a l i z a t i o n)和S i L U(S i g m o i d L i n e a r U n i t)激活函数层构成YO L O v 5 s中的标准卷积模块,并将其命名为C B S(C o n v o l u t i o n l a y e r a n d B a t c

29、h n o r-m a l i z a t i o n a n d S i L U)模块,其中C B S_l表示第l个标准卷积模块。YO L O v 5 s借鉴C S P N e t(C r o s s S t a g e P a r t i a l N e t w o r k)2 6设计了2种C 3结构,使用由卷积模块堆叠的2个并行支路分别处理输入特征图;然后将2个支路输出的特征图进行拼接,得到最终的输出特征图。本文修改图1中C 3_6、C 3_7和C 3_8模块的激活函数,故对其结构不做赘述。在YO L O v 5 s中,空间金字塔池化模块S P P(S p a t i a l P y r

30、 a m i d P o o l i n g)2 7位于骨干网络的末端,通过卷积以及不同尺寸的最大值池化从特征图中获取不同粒度的特征,为N e c k部分提供丰富的语义信息。(2)N e c k。YO L O v 5 s的N e c k部分结合了特征金字塔网络F P N(F e a t u r e P y r a m i d N e t-w o r k)2 8和路径聚合网络P AN(P a t h A g g r e g a t i o n N e t w o r k)2 9结构。随着网络深度的增加,特征图向尺寸更小、深度更深的方向变化。底层的大尺寸特征图包含更准确的定位信息,而顶层

31、小尺寸特征图包含更抽象的语义信息。YO L O v 5 s使用F P N通过上采样自顶向下传达强语义信息,使用P AN通过下采样自底向上传达强定位信息,二者优势互补,提高了算法的特征融合能力。(3)H e a d。H e a d部分对N e c k输出的特征图P1、P2和P3进行卷积处理,分别针对大、中、小不同尺寸的目标进行识别,预测目标的类别并生成边界框。本文以YO L O v 5 s为基础算法,将C 3_6、C 3_7和C 3_8模块的激活函数替换为F R e L U(F u n n e l R e c t i f i e d L i n e a r U n i t)3 0;将B a c

32、k B o n e部分的C B S_2、C B S_3和C B S_4这3个浅层的标准卷积模块替换为多感受野卷积模块;将N e c k部分的C B S_5、C B S_6、C B S_7和C B S_8这4个深层的标准卷积模块替换为特征图卷积模块。3 改进卷积模块本文通过更高效的模块设计提高算法的特征6501C o m p u t e r E n g i n e e r i n g&S c i e n c e 计算机工程与科学 2 0 2 3,4 5(6)提取能力、减少特征图冗余;通过引入F R e L U激活函数提高模型的非线性表达能力。3.1 多尺度特征提取模块多尺度特征提取模块结构如

33、图2所示,包括2个子模块:多感受野卷积模块M u R C(M u l t i R e-c e p t i v e-f i e l d C o n v o l u t i o n)(图2 a),用于B a c k B o n e部分,能够提高特征提取能力;特征图卷积模块(图2 b),用于N e c k部分,可以提高特征图的多样性,减少相似特征图数量。F i g u r e 2 M u l t i-s c a l e f e a t u r e e x t r a c t i o n m o d u l e图2 多尺度特征提取模块3.1.1 多感受野卷积模块卷积神经网络通过卷积核进行特征提取,卷积

34、核的尺寸越大,意味着可以从更大的区域中提取特征,模型的非线性表达能力越强。标准卷积的卷积核尺寸是固定的,只能以单一感受野提取信息,造成特征图缺少不同粒度的信息。本文基于深度卷积(D e e p w i s e C o n v o l u t i o n)和点卷积(P o i n t w i s e C o n v o l u t i o n)提出的多感受野卷积模块M u R C,可以在多个感受野上进行特征提取和特征融合。图2 a为该模块的结构图,其中,P o i n t C o n v(1,1)表示点卷积,DWC o n v(k,s,C_i,C_o)表示深度卷积,k表示卷积核尺寸,s表示

35、卷积步长,C_i和C_o分别表示输入与输出通道数。分析YO L O v 5 s的B a c k B o n e中的标准卷积模块可知,该模块使用33的卷积核以卷积步长为2对输入特征图进行处理,以卷积核数量控制输出特征图的深度,通过以上方法实现下采样。将卷积表示为从输入到输出的映射,以x表示输入特征图,y表示输出特征图,以f()表示标准卷积、fp()表示点卷积、fd w,k()表示卷积核尺寸为kk的深度卷积,C o n c a tT1,T2 表示对2幅特征图T1和T2进行通道拼接,则标准卷积计算方式如式(1)所示:y=f(x)(1)多感受野卷积模块计算如式(2)所示:y=fp(C o n c a

36、t fd w,3(x),fd w,5(x)(2)假设输入特征图尺寸为WWD,输出特征图尺寸为WWN,卷积核尺寸为KK,则标准卷积的计算量如式(3)所示:C1=WWDKKN(3)深度卷积的计算量如式(4)所示:C2=WWDKK(4)点卷积的计算量如式(5)所示:C3=WWDN(5)通过比较计算公式以及计算量可见,标准卷积虽然形式简单,但其计算量为深度卷积的N倍、点卷积的K2倍,且只能以一个感受野提取信息,不是一种高效的信息提取方式。本文提出的多感受野卷积模块能够实现比标准卷积模块更有效的特征提取。如图2 a所示,该模块首先使用不同尺寸卷积核的深度卷积分别对输入特征图进行特征提取,获得2幅具有不同

37、粒度语义信息的特征图;然后对获得的2幅特征图进行通道拼接;最后使用点卷积对拼接后的特征图进行跨通道处理,建立特征图通道间的联系。由于目标检测任务中目标的尺寸是多变的,因此使用不同尺寸的卷积核从特征图中提取不同粒度的信息有利于提高检测性能。单纯的深度卷积缺少通道间的信息流通,所以使用点卷积处理拼接后的特征图,有利于提高特征提取能力。3.1.2 特征图卷积卷积神经网络输出的特征图经可视化后可以得到很多相似的图像。由特征图间普遍存在的相似性可以推测其中可能存在许多冗余信息。本文使用标准卷积与分组卷积构建特征图卷积模块,以减少特征图的冗余。标准卷积与分组卷积的区别主要在于卷积计算使用的深度通道,前者使

38、用所有深度通道的信息,而后者根据分组数使用部分通道信息,如图3所示。F i g u r e 3 S t a n d a r d c o n v o l u t i o n a n d g r o u p e d c o n v o l u t i o n图3 标准卷积与分组卷积在卷积神经网络向更深的层发展的过程中,关于其中存在的特征图冗余性的研究较少。G h o s t-N e t3 1的设计人员对特征图的冗余性展示出积极7501李校林等:基于多尺度特征提取的YO L O v 5 s算法优化的态度,认为冗余性可能是深度神经网络的一个重要特征,并基于此观点设计了G h o s t卷积模块,利用简

39、单的线性变换生成冗余特征图,以减少参数量,降低计算复杂度。本文认为标准卷积使用输入特征图的全部通道进行计算的方式可能是生成许多相似特征图的主要原因。在标准卷积中,输入特征图的所有通道都参与卷积计算,而距离较远的通道间可能并不具有相关性,导致卷积核根据无关信息进行特征提取,无法生成有效的特征图,形成通道间的相互制约。因此,本文利用分组卷积和较少的标准卷积减小通道间的约束,使用分组卷积从标准卷积生成的特征图上提取信息生成新的特征图,并以之取代可能存在冗余特征的特征图。基于此观点提出了特征图卷积模块F m C(F e a t u r e m a p C o n v o l u t i o n),以减

40、少特征图的冗余。特征图卷积模块如图4所示,该模块首先通过较少的标准卷积核生成一部分特征图,称为身份特征I d F(I d e n t i t y F e a t u r e);然后使用分组卷积对身份特征进行卷积计算,生成另一部分特征,称为强化特征A d F(A d-v a n c e d F e a t u r e);最后将身份特征与强化特征通过通道拼接构成完整的输出特征图。F i g u r e 4 F e a t u r e m a p c o n v o l u t i o n图4 特征图卷积模块相较于标准卷积或G h o s t卷积,特征图卷积生成的特征图更多样、丰富性更好。同标准卷积

41、相比,它首先使用较少的标准卷积核生成身份特征,然后使用分组卷积生成强化特征,有效避免了通道间的相互制约;同G h o s t卷积利用冗余性减少网络参数的方法相比,特征图卷积选择将冗余特征替换为强化特征,提高了特征图的表达能力。3.2 激活函数激活函数可以对数据进行非线性变换,去除数据中的冗余信息并保留有效特征,增强模型的非线性表达能力。本文在保留YO L O v 5 s使用的S w i s h激活函数的同时引进了F R e L U激活函数,以提高模型的非线性表达能力。S w i s h激活函数与常用的激活函数的曲线图如图5所示。S w i s h激活函数的形式如式(6)所示:

42、F i g u r e 5 A c t i v a t i o n f u n c t i o n s图5 激活函数S w i s h(x)=x*S i g m o i d(b x)(6)其中,x表示函数的输入,b表示常数。与其他激活函数相比,S w i s h激活函数具有以下优点:没有上边界,不会出现类似于t a n h函数的梯度饱和现象;有下边界,负半轴上趋近于零,有良好的正则化效果;处处连续并且可导,容易训练。F R e L U激活函数的形式如式(7)所示:y=m a x(x,T(x)(7)其中,x表示输入张量;y表示输出张量;T(x)是取决于空间上下文的条件函数的输出值,其分量T(xc

43、,i,j)与其周围像素的值有关,如图6 a所示。这与取决于像素值本身的S w i s h或P R e L U激活函数有很大不同,P R e L U激活函数可表示为y=m a x(x,p x),其中p表示可学习的通道参数,3种激活函数的原理对比如图6所示。F i g u r e 6 F R e L U a c t i v a t i o n f u n c t i o n a n d g e n e r a l a c t i v a t i o n f u n c t i o n s图6 F R e L U激活函数与一般激活函数F R e L U激活函数通过一个参数窗口建立输入像素与其周围像素

44、的联系,每一个输出值依赖于空间上下文,因此F R e L U激活函数具有更强的非线性能力。对于输入张量中的某个元素,F R e L U激活函数使用参数池窗口在一个通道上创建其与周围多个元素的空间依赖关系,其数学表达如式(8)所示,其中,xc,i,j表示在第c个通道上的二维空间位置(i,j)处的非线性激活函数f()的输入像8501C o m p u t e r E n g i n e e r i n g&S c i e n c e 计算机工程与科学 2 0 2 3,4 5(6)素;函数T(xc,i,j)表示二维空间条件,具体如式(9)所示,xwc,i,j表示以xc,i,j为中心、尺寸为kwkw的

45、参数池窗口,pwc表示此窗口在同一通道中共享的系数。f(xc,i,j)=m a x(xc,i,j,T(xc,i,j)(8)T(xc,i,j)=xwc,i,jpwc(9)由于式(9)空间条件通过可学习的参数窗口实现,所以F R e L U激活函数会带来少量参数增加。为控制模型参数量,保持模型实时检测性能,本文只将F R e L U激活函数用于B a c k B o n e的多感受野卷积模块的点卷积部分和生成用来检测目标位置的特征图的C 3模块的输出端,其他位置的激活函数均采用S w i s h激活函数,以保证模型具有更强的非线性表达能力和实时检测性能。4 实验与分析本文基于P A S C A L

46、 VO C数据集评估改进算法的性能,实验环境为P y T h o n 3.8、P y t o r c h 1.8.0,训练环境为I n t e l C o r e i 9-1 0 9 8 0 X E C P U,NV I D I A R T X 3 0 8 0 G P U,测试环境为I n t e l C o r e i 5-1 1 4 0 0 F C P U,NV I D I A R T X 3 0 6 0 G P U。实验以P A S C A L VO C 2 0 0 7和P A S C A L VO C 2 0 1 2 共1 6 5 5 1幅图像作为训练集,以P A S C A L VO

47、 C 2 0 0 7 t e s t为测试集,共4 9 5 2幅图像。首先通过消融实验对比分析每个模块的有效性,然后将本文算法的实验结果与其他主流算法的实验结果进行比较。为全面比较不同算法的差别,本文设置了多个评价指标从多个角度对算法进行比较和衡量。此外,本文还采用与P A S C A L VO C数据集有显著差异的D OT A数据集设计实验,通过与主流算法的对比,证明了改进算法能够适应不同的检测环境,具有良好的检测效果和泛化能力。4.1 评价指标本文采用mA P_0.5、mA P_0.5:0.9 5和召回率评价算法检测准确率,采用F P S(F r a m e s P e r S e c o

48、 n d)比较不同算法的检测速度。mA P计算方法如式(1 0)所示:mA P=Nn=1A PnN(1 0)A P=10P(R)dR(1 1)其中,A Pn(A v e r a g e P r e c i s i o n)反映算法检测类别n的准确性;N表示类别总数;R表示召回率(R e-c a l l),反映模型检测的全面性;P表示准确率(P r e-c i s i o n),反映模型识别正负样本的准确性。准确率P和召回率R的计算方法分别如式(1 2)和式(1 3)所示:P=T PT P+F P(1 2)R=T PT P+FN(1 3)其中,T P表示正确预测的正样本数量,F P表示错误预测的

49、正样本数量,FN表示错误预测的负样本数量。mA P_0.5是指I o U阈值设置为0.5时的平均准确率;mA P_0.5:0.9 5是指在0.5,0.9 5 以0.0 5为间隔作为I o U阈值的平均准确率,其计算方法如式(1 4)所示:mA P_0.5:0.9 5=9k=0mA P0.5+0.0 5k 1 0(1 4)4.2 消融实验为了证明多感受野卷积模块和特征图卷积模块的有效性,实验使用2个模块设计了3种不同变体,分别进行训练和测试以比较它们的性能。为保证比较的公平性,不同变体的实验只是改变了相应的模块而没有优化方法或超参数的改变。实验结果如表1所示。T a b l e 1 R e s

50、u l t s o f a b l a t i o n e x p e r i m e n t s表1 消融实验结果算法m A P_0.5/%m A P_0.5:0.9 5/%F P SR/%YO L O v 5 s7 9.15 3.31 0 97 5.2YO L O v 5 s+M u R C7 9.85 4.61 0 77 5.5YO L O v 5 s+F mC8 0.95 6.71 1 07 5.7YO L O v 5 s+M u R C+F m C8 1.55 8.21 0 67 6.1 观察实验结果可见,分别使用M u R C模块和F m C模块替代相应标准卷积模块的改进算法均取得

下载提示：咨信网仅提供存储空间/不修改/不编辑

【自信AI创作助手】【自信AI导航】
1、请仔细预览页面，基本判断完整性，对于直接下载带来的问题请及时与客服沟通；下载的文档，不会出现我们的网址水印。
2、该文档所得收入（下载+内容+预览）归上传者、原创作者；如果您是本文档原作者，请点此认领！既往收益都归您。

同意并开始全文预览

举报此文档有问题？有机会获“体验VIP”奖励！

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

10 金币 0人已下载

申诉本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请申请举报、认领或删除 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 基于尺度特征提取 YOLOv5s 算法优化李校林

咨信网温馨提示：
1、咨信平台为文档C2C交易模式，即用户上传的文档直接被用户下载，收益归上传人（含作者）所有；本站仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿，我们不确定上传用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的版权、权益或隐私，请联系我们，核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据，平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺，下载前须认真查看，确认无误后再购买，务必慎重购买；若有违法违纪将进行移交司法处理，若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传，付费前请自行鉴别，如您付费，意味着您已接受本站规则且自行承担风险，本站不进行额外附加服务，虚拟产品一经售出概不退款（未进行购买下载可退充值款），文档一经付费（服务费）、不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印，是因预览和防盗链等技术需要对页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有水印标识（原文档上传前个别存留的除外），下载后原文更清晰；试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓；PPT和DOC文档可被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；PDF文档不管是原文档转换或图片扫描而得，本站不作要求视为允许，下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用；网站提供的党政主题相关内容(国旗、国徽、党徽－－等)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
6、文档遇到问题，请及时私信或留言给本站上传会员【自信****多点】，需本站解决可联系【微信客服】、【 QQ客服】，若有其他问题请点击或扫码反馈【服务填表】；文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“【版权申诉】”（推荐），意见反馈和侵权处理邮箱：1219186828@qq.com；也可以拔打客服电话：4008-655-100；投诉/维权电话：4009-655-100。