基于改进Swin Transformer的舰船目标实例分割算法.pdf
《基于改进Swin Transformer的舰船目标实例分割算法.pdf》由会员分享,可在线阅读,更多相关《基于改进Swin Transformer的舰船目标实例分割算法.pdf(9页珍藏版)》请在咨信网上搜索。
1、第 卷第 期 年 月系统工程与电子技术 文章编号:()网址:收稿日期:;修回日期:;网络优先出版日期:。网络优先出版地址:基金项目:装备预研领域基金()资助课题通讯作者引用格式:钱坤,李晨蠧,陈美杉,等基于改进 的舰船目标实例分割算法系统工程与电子技术,():犚犲 犳 犲 狉 犲 狀 犮 犲犳 狅 狉犿犪 狋:,():基于改进犛狑 犻 狀犜 狉 犪 狀 狊 犳 狅 狉犿犲 狉的舰船目标实例分割算法钱坤,李晨蠧,陈美杉,郭继伟,潘磊(海军航空大学岸防兵学院,山东 烟台 ;中国人民解放军 部队,辽宁 大连 ;航天工程大学研究生院,北京 )摘要:针对反舰武器图像制导目标实例分割精度低,模型中上下文语
2、义交互不充分,特征融合推理速度慢,数据集难易样本不均衡导致训练效果差等问题,提出了一种基于改进滑动窗口的 (,)的舰船目标实例分割算法。设计了局部增强感知模块用以拓展感受野,加强语义交互能力;采用反向特征金字塔网络进行特征融合,提高算法处理速度;使用在线困难样例挖掘,改善数据集样本不均衡问题,提升网络训练效果。实验结果表明,改进后的算法相较基线算法在分割准确率上提升了,在处理速度上提高了,兼具精度和速度优势。关键词:;反向特征金字塔;在线困难样例挖掘;舰船实例分割中图分类号:文献标志码:犇犗犐:犛 犺 犻 狆狋 犪 狉 犵 犲 狋犻 狀 狊 狋 犪 狀 犮 犲狊 犲 犵犿犲 狀 狋 犪 狋 犻
3、 狅 狀犪 犾 犵 狅 狉 犻 狋 犺犿犫 犪 狊 犲 犱狅 狀犻 犿狆 狉 狅 狏 犲 犱犛狑 犻 狀犜 狉 犪 狀 狊 犳 狅 狉犿犲 狉,(犆狅 犾 犾 犲 犵 犲狅 犳犆狅 犪 狊 狋 犪 犾犇犲 犳 犲 狀 狊 犲犉狅 狉 犮 犲,犖犪 狏 犪 犾犃犲 狉 狅 狀 犪 狌 狋 犻 犮 犪 犾犝狀 犻 狏 犲 狉 狊 犻 狋 狔,犢犪 狀 狋 犪 犻 ,犆犺 犻 狀 犪;犝狀 犻 狋 狅 犳狋 犺 犲犘犔犃,犇犪 犾 犻 犪 狀 ,犆犺 犻 狀 犪;犇犲 狆犪 狉 狋犿犲 狀 狋狅 犳犌狉 犪犱狌 犪 狋 犲犕犪 狀 犪犵 犲犿犲 狀 狋,犛狆犪 犮 犲犈狀犵 犻 狀 犲 犲 狉 犻
4、狀犵犝狀 犻 狏 犲 狉 狊 犻 狋 狔,犅犲 犻 犼 犻 狀犵 ,犆犺 犻 狀 犪)犃犫 狊 狋 狉 犪 犮 狋:,犓犲 狔狑狅 狉 犱 狊:();();引言近年来,随着计算机图形算力的爆发式增长和人工智能算法的长足进步,计算机视觉领域进入了新的技术时代,图像分割作为计算机视觉的重要分支,是根据一定的规则将图像中的像素分成不同的部分,并添加相应标签,可以视 系统工程与电子技术第 卷为是图像分类识别向像素级的延伸,而其中的实例分割兼具了目标检测和语义分割的双重任务,在实现上更具挑战意义和实用价值。目前,实例分割已经广泛应用于汽车自动驾驶、智能辅助医疗和遥感影像判读等民用领域。在军事应用上,实例
5、分割也是精确制导、侦察监视等研究领域的核心问题,对于推进军事现代化和信息化有着重要意义。早期的实例分割受益于目标检测相关研究成果的延伸,等首次使用同时检测和分割算法通过生成建议框、特征提取、区域分类与改良等步骤同时完成了检测和分割操作。等人提出的掩模区域卷积神经网络(,)是一种功能强大的基线算法,通过添加预测兴趣区域的语义分割分支能够高效地完成实例分割任务,也引领了后续一系列改进算法的产生,如掩模评分区域卷积神经网络(,)、边界保持 (,)等。等人提出的全卷积网络(,)是一种端到端的图像分割方法,通过使用全卷积网络、反卷积层和跳跃连接实现了图像分割,成为该领域的代表性算法。为进一步提升算法的精
6、度,等人提出了只看系数算法(,),该算法通过两个并行的子网络来实现实例分割,一个用来得到类似的分割原型图,另一个用来得到检测框,然后融合原型图和检测框后得到掩码,其在处理速度上实现了突破,成为首个能够完成实时实例分割的算法,随后的算法继续优化了算法结构和执行效率,进一步提升了算法速度和精度。近两年来,发轫于自然语言处理(,)的 模型在计算视觉领域大放异彩,在实例分割研究中相较传统展现出了极强的竞争力。基于 的实例分割算法 是首个基于 的实例分割框架,通过使用循环细化策略进行检测和分割,为实例分割提供了新角度。随后的基于 的图像分割算法,使用 预测每个实例类别,并动态生成具有多个分割的掩码级上采
7、样模块,该算法与原始 相比在运算速度和资源开销上更具优势。基于滑动窗口的 (,)实例分割算法,使用滑动窗口策略和层级化设计,其将注意力计算限制在一个窗口中,旨在引入与卷积类似的局部性操作,并显著降低计算量,进一步提高了实例分割的速度和精度。随着对 模型研究的不断深入,如何在保持较低运算开销条件下尽量充分地实现上下文信息的交互,如何理解算法中自注意力机制的作用方式以及如何对其他模块进行优化等问题的提出,为进一步提升 模型性能提供了可能的方向。海战场舰船目标精确识别与分割是反舰导弹末段图像制导的核心问题,对于舰船目标的检测识别算法很多,但细化至像素级的实例分割研究相对较少,已有研究也多是针对合成孔
8、径雷达(,)图像进行实例分割,而图像多为高空俯视视角,从俯视视角得到的舰船轮廓相对单一,对于数据集的准备和训练也相对容易。目前,现役主战反舰导弹为保证隐蔽突防的成功率,多采用低飞掠海攻击模式,从舰船侧视角接近目标时,舰船目标的尺度和角度变化更加剧烈,因此对于算法的要求也更高。为进一步提升海战场目标检测能力,实现精确化打击,对于将一般的目标检测识别延伸细化至像素级精度的实例分割,有着很强的实战意义。本文提出了一种将改进 作为骨干网络的舰船目标实例分割算法,在 模块前增加了局部增强感知模块,旨在提高网络的上下文信息交互能力并拓展感受野,提高分割精度;在特征融合中使用反向特征金字塔(,)网络,在优化
9、分割准确率的同时进一步提升图像处理速度;使用在线困难样例挖掘方法,改善自制数据集难易样本失衡问题,优化算法在小样本数据集条件下的训练效果;在经过自制的舰船目标数据集训练后,相关实验结果表明,算法能够实现多角度、多尺度舰船目标实例分割,分割边缘清晰准确,相较基线算法兼具精度和速度优势。基于犛狑 犻 狀犜 狉 犪 狀 狊 犳 狅 狉犿犲 狉的实例分割算法 犜 狉 犪 狀 狊 犳 狅 狉犿犲 狉模型结构 模型最先在任务中被广泛应用,在任务中需要编码器抽取很多特征。其中,首先需要考虑的就是每个词的上下文语义,因为每个词的具体含义都跟上下文强相关,而上下文又分为方向和距离两个属性,传统的循环神经网络(,
10、)只能对句子进行单向编码,只能对短句进行编码,而 既可以同时编码双向语义,又能够抽取长距离特征,所以在上下文语义抽取方面要优于和。任务需要抽取的第二种特征是序列的顺序,在这方面 的表现一般介于和之间。任务对计算速度是比较敏感的,由于无法并行处理序列信息,因此表现最差,和 都可以进行并行计算,但 模型结构稍显复杂,所以在速度方面稍逊。综上,由于 在效果和速度方面性能表现均衡,所以在任务中很快便脱颖而出,之后随着研究的深入,被引入其他任务中,均有不俗表现,已隐隐呈现出成为高效的通用计算架构的趋势。模型是一种典型的编码器 解码器结构,其中最为重要是多头自注意力(,),残差连接和归一化(,第 期钱坤等
11、:基于改进 的舰船目标实例分割算法 )以及前馈网络个模块。负责将输入投影到不同空间,得到犙、犓、犞这个矩阵,投影操作是避免后续矩阵犙和犞直接进行点积操作,并使输入的每个部分能够融合上下文的语义,增加多样性,之后再进行注意力的计算。在 模块中先对注意力计算的输出进行投影和随机舍弃运算,加上原始输入后再进行操作,添加原始输入是参考了残差连接的思想,相当于在求导时增加了一个恒等项,达到避免发生梯度消失的目的。同时,归一化的做法在神经网络中主要起到提升网络泛化性的作用,另外,将归一化设置在激活函数之前,也能够有效避免数据落入饱和区,进一步减少梯度消失的情况。前馈网络模块主要作用是给 提供非线性变换,提
12、升拟合能力,在这一过程中选择了高斯误差线性单元(,)函数 作为激活函数,因为函数引入了正则思想,越小的值越有可能被舍弃,相当于线性修正单元函数(,)和随机舍弃的综合,因为 函数的值只有和,所以单纯使用就缺乏这样的随机性。基于犛狑 犻 狀犜 狉 犪 狀 狊 犳 狅 狉犿犲 狉的实例分割算法原理 的创新性思想主要表现在层次性、局部性以及平移不变性。层次性体现在特征提取阶段使用了类似中的层次化构建方法,对输入图像分别进行倍、倍和 倍的下采样,得到多尺度特征图。局部性主要体现在自注意力计算过程中,将计算约束在划分好的局部非重叠窗口内进行,使得算法复杂度从此前的和图像大小的平方关系变成了线性关系,大幅降
13、低了计算量,提升了算法效率。在前后两层的 模块中,非重叠窗口的划分相比前一层做了半个窗口的偏移,这样使得上下两个窗口的信息得到了有效交互,相比于中常见的滑动窗口设计,保持了平移不变性的同时也没有造成准确率的降低。的算法流程大致如下,输入图像为犎犠大小的(,)三通道图像,首先通过图块分割模块进行分块操作,分为大小的图块,之后沿个通道方向进行展平,展平后大小为,所以通过图块分割后图像由犎,犠,变为犎,犠,而后通过线性嵌入模块对每个像素通道数据进行线性变换,得到犎,犠,犆,以上操作均通过二维卷积实现,具体结构如图所示。图 网络结构 随后数据进入 模块,经归一化后,进入窗口多头自注意力(,)计算模块,
14、将图像块进一步划分成互不重叠的区域,并在区域内计算自注意力;多层感知机(,)是一个使用函数作为激活函数的前馈网络,旨在完成非线性变换,提升算法拟合能力。由于在中,只会在每个窗口内进行自注意力计算,所以窗口与窗口之间是无法进行信息传递的。为此,引入了偏移(,)模块,在第犔层划分互不重叠窗口后,在第犔层内偏移半个窗口距离重新划分窗口,使得不同层中有部分窗口的信息得以交互,以上操作可以归结为第一阶段,模块结构如图所示。图 模块结构 为了得到多尺度的特征信息,还需要构建一个层级式结构,网络中设计了图块拼接模块,来实现类似中池化操作,经过拼接过后图像的宽高尺寸减半,通道数翻倍,而后再通过 模块,这样的结
15、构以串联的形式相连,即图中的第阶段到第阶段。为应对不同需求,实现了网络结构的系列化,其网络由简单到复杂依次是 ,和 ,网络越复杂性能越强,但相应的计算开销也越大,图就是以 为例绘制的。基于改进犛狑 犻 狀犜 狉 犪 狀 狊 犳 狅 狉犿犲 狉的舰船目标实例分割算法 算法框架本算法使用 作为骨干网络,完成特征提取工作,图像进入图像分割模块后形成序列化小块,并沿通道方向展平,通过线性嵌入模块完成线性到非线性再到线性的次变换;在进入 块前,先通过局部增强感知(,)模块,旨在进一步抑制无效特征,增强有效参数,提高上下文信息之间的 系统工程与电子技术第 卷交互;在特征融合阶段使用 网络,在采用局部融合操
16、作的同时,集成高级与低级特征,获得更好的融合效果和更低的延迟;在网络的训练阶段,使用在线困难样例挖掘(,)方法,解决自制数据集难易样本不均衡,训练效果不理想的问题,通过设置负样本池反复迭代,使算法在小样本数据集上获得更好的效果;最后使用基于 的检测头,完成实例分割任务。算法整体框架如图所示。图算法框架 局部增强感知模块在 模型中,为了在与图像大小成线性关系的计算复杂度下尽可能地实现上下文语义信息的“全局”范围交互,在层次化结构中使用偏移窗口方案来实现不同窗口间的信息交互。但实际上,每次偏移半个窗格,在空间上依然存在大量上下文信息不能很好地交流,为此,本文提出了在 模块前插入一个局部增强感知模块
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于改进Swin Transformer的舰船目标实例分割算法 基于 改进 Swin Transformer 舰船 目标 实例 分割 算法
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。