基于改进YOLOX的遥感影像目标检测算法.pdf
《基于改进YOLOX的遥感影像目标检测算法.pdf》由会员分享,可在线阅读,更多相关《基于改进YOLOX的遥感影像目标检测算法.pdf(10页珍藏版)》请在咨信网上搜索。
1、第 卷第期 年月 吉 林 大 学 学 报(地 球 科 学 版)J o u r n a l o f J i l i nU n i v e r s i t y(E a r t hS c i e n c eE d i t i o n)V o l N o J u l y 李美霖,芮杰,金飞,等基于改进YO L O X的遥感影像目标检测算法吉林大学学报(地球科学版),():d o i:/j c n k i j j u e s e L iM e i l i n,R u i J i e,J i nF e i,e t a l R e m o t eS e n s i n g I m a g eT a r g
2、e tD e t e c t i o nA l g o r i t h mB a s e do n I m p r o v e dYO L O X J o u r n a l o fJ i l i nU n i v e r s i t y(E a r t hS c i e n c eE d i t i o n),():d o i:/j c n k i j j u e s e 基于改进Y O L O X的遥感影像目标检测算法李美霖,芮杰,金飞,刘智,林雨准中国人民解放军战略支援部队信息工程大学地理空间信息学院,郑州 部队,北京 摘要:目标检测是遥感影像处理中一项基础性和常规性的工作.本文基于YO
3、 L O X(y o uo n l yl o o ko n c eX)网络进行改进,设计了一种针对遥感影像目标的检测算法.首先在特征提取模块P AN e t(p a t ha g g r e g a t i o nn e t w o r k)中加入自适应空间特征融合(a d a p t i v e l ys p a t i a l f e a t u r e f u s i o n,A S F F)网络,针对目标检测中尺度不一致的细部特征进行深入挖掘.其次,设计了基于E C A(e f f i c i e n tc h a n n e l a t t e n t i o n)的特征提取模块,高
4、效通道交互在更加关注特征图中正样本特征信息的同时降低了模型的复杂性.再次,为了避免过拟合造成梯度消失、激活效果弱的问题,提出使用s w i s h激活函数.最后,在D O TA(d a t a s e t f o ro b j e c td e t e c t i o n i na e r i a l i m a g e s)上进行实验,通过消融实验定性分析、通过对比实验定量验证了本文算法的最佳机制和有效性.结果表明:在添加A S F F和E C A机制并且优化s w i s h激活函数的前提下,改进网络模型的全类平均正确率(m e a na v e r a g ep r e c i s i
5、o n,mA P)达 ,较原始网络提升了 ;与当前应用广泛的目标检测算法M o b i l e n e t YO L O v、YO L O v、Y O L O v、Y O L O X相比,本文算法实现了mA P 的提升.关键词:摄影测量;遥感;目标检测;D O TA;E C A;A S F Fd o i:/j c n k i j j u e s e 中图分类号:P 文献标志码:A收稿日期:作者简介:李美霖(),女,硕士,主要从事遥感影像智能解译方面的研究,E m a i l:q q c o m基金项目:国家自然科学基金项目()S u p p o r t e db yt h eN a t i o
6、 n a lN a t u r a lS c i e n c eF o u n d a t i o no fC h i n a()R e m o t eS e n s i n gI m a g eT a r g e tD e t e c t i o nA l g o r i t h mB a s e do nI m p r o v e dY O L O XL iM e i l i n,R u i J i e,J i nF e i,L i uZ h i,L i nY u z h u nI n s t i t u t eo fG e o s p a t i a l I n f o r m a t
7、i o n,P L AS t r a t e g i cS u p p o r tF o r c eI n f o r m a t i o nE n g i n e e r i n gU n i v e r s i t y,Z h e n g z h o u ,C h i n a T r o o p s,B e i j i n g ,C h i n aA b s t r a c t:T a r g e td e t e c t i o n i s a f u n d a m e n t a l a n dr o u t i n e t a s k i nr e m o t e s e n s
8、i n g i m a g ep r o c e s s i n g I nt h i sp a p e r,w ed e s i g nat a r g e td e t e c t i o na l g o r i t h mf o rr e m o t es e n s i n gi m a g e sb a s e do nt h eYO L O Xn e t w o r k F i r s t l y,A S F F i s a d d e d t o t h e f e a t u r e e x t r a c t i o nm o d u l eP AN e t t od e
9、e p l ym i n e t h e f i n e f e a t u r e sw i t hi n c o n s i s t e n ts c a l ei nt a r g e td e t e c t i o n S e c o n d l y,a n E C A b a s e df e a t u r ee x t r a c t i o n m o d u l ei sd e s i g n e dw i t he f f i c i e n tc h a n n e l i n t e r a c t i o nt or e d u c et h ec o m p l
10、e x i t yo ft h em o d e lw h i l ep a y i n g m o r ea t t e n t i o nt ot h ep o s i t i v es a m p l ef e a t u r e i n f o r m a t i o ni nt h ef e a t u r em a p T h e n,t oa v o i dt h ep r o b l e mo fg r a d i e n td i s a p p e a r a n c ea n d w e a ka c t i v a t i o ne f f e c tc a u s e
11、 db yo v e r f i t t i n g,t h eu s eo fs w i s ha c t i v a t i o nf u n c t i o n i sp r o p o s e d F i n a l l y,e x p e r i m e n t sa r ec o n d u c t e do nD OT At ov e r i f yt h eb e s tm e c h a n i s ma n de f f e c t i v e n e s so ft h ei m p r o v e d m e t h o dt h r o u g hq u a l i
12、t a t i v ea n a l y s e so ft h ea b l a t i o ne x p e r i m e n t sa n dq u a n t i t a t i v ec o m p a r i s o n e x p e r i m e n t s W i t ht h ea d d i t i o n o f A S F F a n d E C A m e c h a n i s m sa n dt h eo p t i m i z a t i o no f t h e s w i s ha c t i v a t i o n f u n c t i o n,t
13、 h e i m p r o v e dn e t w o r km o d e l a c h i e v e s a nmA Po f ,a n i m p r o v e m e n to f o v e rt h eo r i g i n a ln e t w o r k C o m p a r e dw i t ht h ec u r r e n tw i d e l yu s e dt a r g e td e t e c t i o na l g o r i t h m sM o b i l e n e t YO L O v,YO L O v,YO L O v a n dYO L
14、 O X,t h ep r o p o s e da l g o r i t h ma c h i e v e sa n i m p r o v e m e n to f i nmA Pa c c u r a c y K e yw o r d s:p h o t o g r a mm e t r y;r e m o t es e n s i n g;t a r g e td e t e c t i o n;D OT A;E C A;A S F F引言遥感影像目标检测在地形图测绘、情报 侦察、城市规划等方面具有重要的应用价值.与传统的自然图像不同,遥感影像中的大量目标信息较为破碎,背景更加复杂,
15、从而导致特征图上干扰信息多,个别地物目标分布密集,加剧了遥感图像目标检测的难度.传统算法在目标分割分类上的效果不佳,复杂条件下精度低,易漏检.随着人工智能技术的发展,研究人员使用深度学习技术解决遥感图像目标检测问题在多个开源目标数据集上的检测效果已远超传统算法.现有基于深度学习技术的遥感图像目标检测算法主要分为两大类:基于候选区域(t w os t a g e)的方法和基于回归分析(o n es t a g e)的方法.前者适用最广泛的为R C NN(r e g i o n s w i t h c o n v o l u t i o n a l n e u r a ln e t w o r k
16、f e a t u r e s)及后续系列改进算法.G i r s h i c k等提出R C NN算法,对每个候选区域进行尺度归一化,根据所提取特征进行支持向量机分类和边界框 回 归.G i r s h i c k在 此 基 础 上 提 出f a s tRC NN算法,基于感兴趣区域池化(r e g i o no f i n t e r e s tp o o l i n g)进 行 区 域 特 征 选 择.R e n等提 出 了f a s t e rRC NN算法,将生成的候选区域融入模型网络中,级联了从端到端的目标检测网络,算法检测更为高效,精度极大提升.基于回归分析的目标检测算法相较于基
17、于候选区域方法,省去了生成候选区域的步骤,在处理速度方面具有较强优势.基于回归分析的光学遥感图像目标检测以YO L O(y o uo n l y l o o ko n c e)系列为代表.其检测算法衍生出多种专项组合网络,在小目标、多尺度、多模态变化 等具有挑战性的遥感检测场景中,性能相较于原网络明显提升.但上述卷积神经网络算法在实际应用方面还存在一些问题,如多尺度特征提取对高层特征图中的弱小特征加强提取不足,目标细节化特征和语义化作用 发挥不明显;密集目标检测无法对重合目标的数量和比例进行准确的分析回归;模型网络过饱和引起梯度消失和过拟合泛化性差等.算法目标检测的精度难以满足实际需求,针对不
18、同类型的检测对象泛化能力和识别精度仍需提高.针对上述遥感影像目标检测面临的挑战,依靠YO L O系列目标检测算法在高精度、高像素遥感目标检测领域的较大潜力和其轻量化、便携性强的部署优势,本文在改进的YO L O X(y o uo n l y l o o ko n c eX)网络基础上提出了一种新的遥感影像目标检测 算 法.首 先 在 特 征 提 取 模 块P AN e t(p a t ha g g r e g a t i o nn e t w o r k)加入了自适应空间特征融合(a d a p t i v e l ys p a t i a l f e a t u r ef u s i o n
19、,A S F F)网络,以解决多尺度目标检测问题.其次,设计了基于E C A(e f f i c i e n tc h a n n e la t t e n t i o n)的 特 征 提 取 模块,高效通道交互更加关注特征图中正样本特征信息的同时显著降低了模型的复杂性.再次,为了避免过拟合造成梯度消失、激活效果弱的问题,提出使用s w i s h激活函数.最后,通过消融实验和对比试验,从改进机制选取上进行定性对比,利用平均正确率(a v e r a g ep r e c i s i o n,A P)和全类平均正确率(m e a na v e r a g ep r e c i s i o n,
20、mA P)两项指标进行定量评价.Y O L O XYO L O X是旷世公司 年月提出的新型单阶段目标检测网络,在沿袭YO L O系列的强大提取能力和深层次网络特性之余,创新使用了F o c u s主干网络、d e c o u p l e dh e a d预测分支解耦、M o s a i c数据增强和a n c h o r f r e e机制.YO L O X网络在YO L O系列中具有代表性和突出性,选择在该算法的基础上进行改进,以更好地解决遥感影像目标检测问题.吉 林 大 学 学 报(地 球 科 学 版)第 卷改进策略本文算法的结构(图)主要由三部分构成:以残差网络和F o c u s模块
21、 为基础的主干网络C S P(c r o s ss t a g ep a r t i a l)D a r k n e t、基于P AN e t的特征金字塔网络(f e a t u r ep y r a m i dn e t w o r k s,F P N)以及以解耦头(d e c o u p l e dh e a d)为基础的YO L O H e a d解耦器检测模块.首先,在主干网络特征图和采样层输出部分添加了不降维E C A,有效避免了降维对于通道注意力学习效果的影响,并可加强提取高层特征图中的弱小特征;其次,在F P N中融合A S F F模块,通过扩大感知域和挖掘高级语义特征,来兼顾底
22、层特征中的细粒度;最后,对全局网络激活函数进行了调 整,在C S P L(c r o s ss t a g ep a r t i a ll a y e r)和C B S(c o n v o l u t i o nb a t c hn o r m a l i z a t i o ns i g m o i dl i n e ru n i t)模块中使用了s w i s h激活函数,在稳定梯度曲线的同时加快收敛.自适应空间特征融合YO L O X使用P AN e t的方式进行特征融合,这种方式无法充分挖掘多尺度特征信息;因此在改进网络中引入A S F F结构,依托每一层的权重参数与特征相乘相加的映射
23、融合,高效过滤其他层的特征,抑制负面信息,保留重要局部区域信息,使得提取的细粒度特征更加精细化和层次化.原理如下.令Xl、Xl、Xl为来自第l层的个特征图,将其与对应的可学习权重相乘并相加得到融合后的特征.第l层特征图学习到的参数为:li jeli jeli jeli jeli j;li jeli jeli jeli jeli j;li jeli jeli jeli jeli j.()式中:i代表行;j代表列;参数li j、li j、li j分别为Xl、Xl、Xl经过卷积得到.这个参数需要满足以下条件:li jli jli j;li j,li j,li j,.()最终在第l层的输出结果为yli
24、 jli jXli jli jXli jli jXli j.()式中,yli j为自适应空间特征融合后得到的新特征图.局部跨通道交互注意力机制为更好地将通道和空间注意信息相结合,避免降维操作对通道注意力的预测产生负面影响,减少不必要、低效率的依赖关系获取,在P AN e t特征提取模块嵌入了E C A模块.对于不降维的聚合特征yRC(C为通道数),其各通道的权重为w(CD,k(y).()S P P空间金字塔池化;B N批标准化.图本文算法网络结构F i g A l g o r i t h m i cn e t w o r ks t r u c t u r e第期 李美霖,等:基于改进YO L
25、O X的遥感影像目标检测算法式中:为标准差;C D,k表示在C个通道中进行卷积核大小为k的一维卷积运算.在E C A模块中,权重矩阵Wk对角线元素互异(wi,j为第i行第j列的权重),各通道间完全独立,有效避免通道间交互作用:Wkw,w,w,kw,w,kw,k wC,Ck wC,C.()式中,k与C成正比,由算法自适应确定:kl o gCo d d.()式中,o d d表示对获得的数值取距离最近的奇数.使用分组卷积对高低维通道进行分组,在共享学习参数的同时降低模型复杂度.该模块将输入特征图进行全局平均池化操作,进行卷积核大小为k的 D卷积操作,经过s i g m o i d函数计算得到不同通道
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 改进 YOLOX 遥感 影像 目标 检测 算法
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。