基于图注意力机制的无人机目标红外跟踪技术.pdf
《基于图注意力机制的无人机目标红外跟踪技术.pdf》由会员分享,可在线阅读,更多相关《基于图注意力机制的无人机目标红外跟踪技术.pdf(14页珍藏版)》请在咨信网上搜索。
1、第 44 卷第 3 期 国 防 科 技 Vol.44,No.3 2023 年 6 月 NATIONAL DEFENSE TECHNOLOGY Jun.2023 收稿日期 2023-03-15 修回日期 2023-04-24 采用日期 2023-04-30 基金项目 国家自然科学基金项目(62075239、61302145)*通信作者 张焱,E-mail: 作者简介 师晓冉,女,硕士,助理工程师,研究方向为自动目标识别;张焱,女,博士,研究员,研究方向为自动目标识别。基于图注意力机制的无人机目标红外跟踪技术 师晓冉1,张 焱2*(1.93202部队,新疆 乌鲁木齐 841700;2.国防科技大学
2、电子科学学院,湖南 长沙 410073)摘 要 近些年来,无人飞行器逐步普及,给社会治安、空域管制、要地防护等领域带来新的威胁。因此,对高威胁、难辨识的无人机目标进行高准确、高稳定的搜索跟踪有着迫切需求。立足城市环境下的反无人机作战需求,针对无人机易受复杂背景干扰、地物遮挡影响及其姿态尺度变化和快速机动造成的跟踪丢失问题,结合图神经网络与注意力机制,提出一种基于图注意力机制的孪生网络无人机目标红外跟踪技术。基于图注意力机制的局部特征匹配模块,通过节点间的信息传递实现全局信息匹配,通过基于图的特征表示和特征交互,增强从目标模板到搜索区域的信息嵌入能力;目标感知区域选择机制可以适应无人机目标尺寸和
3、姿态的变化;基于运动特征设计的切换策略,实现局部跟踪和全局重检测间的动态选择。实验结果表明,在红外无人机目标跟踪时,运用此方法可以取得稳定的跟踪结果,可以有效应对形变、遮挡、复杂背景干扰等挑战,为实现在城市环境中持续稳定跟踪小型无人机目标提供技术参考。关键词 反无人机;红外目标跟踪;孪生网络;图注意力机制 中图分类号 TP391.4 文献标志码 A 文章编号 1671-4547(2023)03-0026-14 DOI:10.13943/j.issn 1671-4547.2023.03.05 引言 当前,无人机行业迅速兴起,小型无人机凭借其低廉的造价、简易的操作以及较高的灵活性和机动性,在军事和
4、民用的诸多领域得到了广泛应用。然而,在改善了生产生活方式的同时,不法分子使用无人机进行骚扰、走私、非法入侵和恐怖袭击等情况时有发生,无人机的恶意使用对公共安全构成严重威胁。尤其是在城市环境中,“低慢小”无人机可以在楼宇间任意穿梭,难以得到有效管控。因此,开展无人机反制技术研究对保障公民以及重点军事防护领域的安全具有重要意义。实现无人机反制,首先要解决“看得见、跟得上”的问题。目前,无人机反制领域常用的探测手段包括电学探测技术、声学探测技术和光学探测技术1。电学探测技术主要包括主动雷达探测和被动无源侦收与定位两项技术。主动雷达探测是目前反无人机系统主要使用的探测手段之一,其技术较为成熟,并且可在
5、探测距离与探测精度方面做适当权衡选择,理论上可实现远距离探测并跟踪“低慢小”目标。雷达部署方式多样,可以单站部署,也可以组网部署。但是,单站雷达受杂波影响和视距限制,其低空目标检测能力弱;雷达组网成本高、难度大,师晓冉,等:基于图注意力机制的无人机目标红外跟踪技术 27 难以大面积快速部署。此外,在城市环境下,楼宇间多杂波干扰,多径效应严重,人员、车辆、飞鸟等干扰目标多,检测准确率较低。由于无人机在飞行过程中会与其控制站之间保持通信联系,因此,可以通过被动无源侦收不同无人机与控制站之间的射频信号、Wi-Fi信号和无线电信号等方式来判断是否存在无人机入侵,并对目标进行定位和跟踪。与雷达探测技术相
6、比,被动无源探测技术具有覆盖范围广、频段全、速度快、隐蔽性较好等优势,但容易受到复杂信号干扰,并且精度较差,往往只能作为其他技术的辅助手段。声学探测技术是指利用无人机的音频指纹进行型号识别的技术。这类技术不仅能够探测到无人机,还能够识别出无人机型号,是未来多技术管控无人机的重要技术手段之一。但是,声学探测技术易受噪声、杂波影响,对于大型无人机的探测效果较好,而中小型无人机声音小,加之城市环境中的噪声干扰严重,导致探测效果不佳。光学探测技术是指利用可见光/红外图像数据对目标进行探测、识别、定位和跟踪的技术。可见光探测技术像素分辨率高、目标纹理清晰、识别效果好,但要求有源照明;红外探测技术虽然比可
7、见光探测技术成像分辨率低,但可以实现夜间探测,且可以应对雨、雪、雾等复杂天候。综上,主动雷达探测技术在远距离“低慢小”目标检测跟踪领域能取得较好效果,但在复杂城市背景下,雷达受多径效应干扰,严重影响其对无人机目标的跟踪性能。被动无源侦收与定位技术易受复杂电磁环境干扰,跟踪精度低,不适用于城市作战。光学探测技术在中近距离时可实现识别级检测,在城市环境下更具有优势。因此,当无人机目标与探测器距离较近(通常为3 km,实际还与探测器性能指标和天气有关)时,使用光学探测技术对无人机目标进行边检测边跟踪,可以有效去除杂波干扰。相较于可见光探测,红外成像探测具备较强的目标背景区分能力。而且,红外热成像探测
8、具有较强的穿透能力,可以避免灰尘、烟雾等因素的遮挡影响,适应复杂背景下的目标检测和识别要求,实现边检测边跟踪;同时,红外成像能够实现全天时工作,并且能更有效地抑制地面杂波。以上特性都使得该技术在检测和跟踪无人机目标方面具有良好的应用前景,因此本文立足于城市环境下的反无人机作战需求,针对红外条件下的无人机目标跟踪技术展开研究。复杂背景下小型无人机目标红外跟踪面临几个难点问题。第一,在无人机飞行过程中,由于探测器拍摄角度不同,目标外观会发生变化。同时,当无人机的飞行姿态和其与探测器间的距离产生较大变化时,红外图像中无人机目标的尺度和外形变化剧烈,可能增大跟踪失败的风险。第二,在信噪比低的恶劣背景环
9、境下,目标受背景热源干扰严重,无人机目标信息容易被掩盖;当背景高度复杂时,目标和背景的区分度较弱,从而降低跟踪的准确性。第三,小型无人机的机动性强,在快速移动时容易出现跟踪丢失问题,导致跟踪结果出现诸多轨迹跳变2。针对上述问题,本文以孪生框架为基础,提出了一种基于图注意力机制的孪生网络红外无人机单目标跟踪算法(GASiam),用于应对复杂场景下跟踪红外无人机目标时面对的遮挡、尺度变化和无人机快速机动的挑战。将算法“图”和“注意力”的概念3引入信息嵌入模块,通过学习节点之间的关系得到目标模板特征与搜索特征之间的局部特征关系映射,充分提取红外弱小目标的低维特征,增强了网络的信息嵌入能力,充分保持了
10、无人机目标的局部细节,提高了算法应对尺度变化和复杂背景的能力。本文还提出了基于运动特征提取的切换策略,该策略通过判断序列相邻帧之间的运动信息,可以实现算法局部跟踪和全局搜索之间的自适应切换,以局部跟踪保证算法的精度和实时性,以全局搜索机制有效解决无人机高速机动导致的跟踪丢失问题。28 国防科技 2023 年第 3 期(总第 340 期)1 算法原理 GASiam 跟 踪 算 法 包 括 基 于 改 进 的MobileNetV24的特征提取网络模块、基于图注意力机制的局部特征匹配模块和局部跟踪/全局搜索切换策略。其中,本文创新性地依靠“图”的特性,设计目标模板到搜索区域之间的信息嵌入方式,因此这
11、三个模块中以基于图注意力机制的局部特征匹配模块为主导。为了对其提供高细粒度的深度特征,设计了特征提取模块;为了补充局部匹配的不足,提出了切换策略。1.1 算法整体框架设计 SiamR-CNN5采用双阶段孪生结构实现了重检测。现有研究表明该结构对于解决无人机目标丢失问题效果较好,因此本文引入包含两次重检测的双阶段孪生结构作为算法的框架结构,大幅降低算法在目标丢失时重新检测和跟踪的风险。GASiam算法网络框架如图1所示。双阶段结构备份了许多轨迹,以确保重检测的成功率。但是,在红外无人机图像中,由于目标严重缺乏纹理细节特征,并且背景往往十分复杂,复杂的检索机制可能会使跟踪效果受到很大影响。针对此种
12、情况,本文提出了以下模块。首先,图神经网络可以直接对图结构进行学习,而注意力模型可以让网络更加注重相关节点,本文将两者的优点相结合,提出一个基于图注意力机制的局部特征匹配模块,即图1中的红色框。该模块可以学习目标模板节点和搜索区域节点之间的关系,通过注意力机制有效提取目标信息,降低背景的权重,使得算法可以更加充分地提取红外小目标的低维特征,保留无人机的局部细节。同时,由于该模块利用的是节点至节点的信息嵌入,而非互相关操作中的全局信息传播,所以这种局部特征匹配模块可以减轻运动过程中目标尺度、形状等变化对跟踪结果带来的影响。其次,针对红外无人机目标的成像面积小和深层特征易被湮没的问题,设计了基于改
13、进的MobileNetV2的特征提取网络,如图1中绿色框所示。将无人机红外图像输入该特征提取网络,可以为图注意力模块提供高细粒度的深度特征。最后,为了补充图注意力模块的局部特征匹配的不足,提出了基于运动特征提取的局部跟踪/全局搜索切换策略,如图1中蓝色框所示。该策略可以通过运动特征对局部跟踪丢失时的运动情况作出判断,并利用双阶段结构存储的历史轨迹信息,动态选取局部跟踪或者全局检测策略。具体来说,GASiam算法运用了一个基于改进的特征提取网络的孪生结构,后接一个可以利用图注意力机制传递图结构特征的局部特征匹配模块,最后利用切换策略,有条件地在全局重检测或者利用图注意力机制进行局部跟踪之间选择,
14、达到最佳的跟踪效果。图1 GASiam算法网络框架 师晓冉,等:基于图注意力机制的无人机目标红外跟踪技术 29 1.2 基于图注意力机制的局部特征匹配模块构建 尽管全局重检测技术可以实现长时间跟踪,但对于严重缺乏纹理细节信息的红外无人机目标来说,持续监测机制容易造成目标的漂移,特别是面对复杂背景时,局部跟踪策略更加符合对无人机跟踪鲁棒性的要求。在利用孪生网络进行局部跟踪时,现有的常用算法是利用互相关运算将目标信息从模板区域传递到搜索区域,然后通过局部搜索进行匹配。但是,由于互相关操作会使用目标模板的全部特征,其中包括了冗余的背景信息;并且这种全局特征匹配会降低目标信息与搜索区域之间的信息传递能
15、力,当搜索区域中目标的形状和姿态变化时,匹配的精度会发生大幅度下降。针对上述问题,本文将“图”和“注意力”的概念相结合,提出基于图注意力机制的局部特征匹配模块,以更精细地提取目标特征。首先,解决什么是“图”的问题。图形结构是一种比树形结构更复杂的非线性结构。在树形结构中,节点间具有分支层次关系,每一层上的节点只能和上一层的至多一个节点相关,但可能和下一层的多个节点相关。在图形结构中,任意两个节点之间都可能相关,即节点之间的邻接关系可以是任意的6。图是由节点和节点之间的连线组成,用于描述对象(节点)之间的相互关系(连线)。图神经网络(Graph Neural Networks,简称GNNs)7是
16、第一种在图上建立神经网络的模型。这种模型使用神经网络来学习图结构数据,从而提取和发掘图结构数据中的特征和模式,在节点分类、边信息传播和图聚类等任务上取得了优良效果。图神经网络将聚合函数定义为一个循环递归函数,在此基础上,将每个节点的邻接节点和邻接边作为其信息源,并更新自身表达8。这种结构使得图神经网络可以有效捕获数据之间的相互依赖关系,确保即使当图的属性(点、边、全局信息)发生改变时,图的排列(即数据间的相互关系)不变。分析认为,利用图神经网络可保持图的排列不变的特点,对目标模板节点和搜索区域节点之间的信息嵌入进行建模,并输入图神经网络进行学习,可以保证在搜索区域的图属性发生改变时,其与目标模
17、板之间的节点相互关系不变。其次,解决什么是“注意力”的问题。在认知科学中,由于信息处理的瓶颈,人类会选择性关注所有信息中的一部分,同时忽略其他可见信息,此机制通常被称为注意力机制。注意力机制的优点是可以通过分配权重处理不同大小的输入。因此,将注意力机制引入图神经网络,可以计算两个节点之间的权重,并根据计算的权重更新目标节点。在这种情况下,邻近矩阵仅被用来定义相关节点,而关联权重的计算则依赖于节点的特征表达,可以看出,注意力机制的引入使得图神经网络更具有鲁棒性和可解释性。根据以上分析,本文认为不同于互相关操作只能进行图像块之间的比较,图神经网络可以以节点形式学习并在目标模板和搜索区域之间传递目标
18、特征。因此,为了更好地应对无人机目标形变带来的挑战,将图神经网络和注意力机制相结合,引入信息嵌入模块,提出了基于图注意力机制的局部特征匹配模块,实现了目标模板与搜索区域之间的局部匹配,具体结构如图2所示。图注意力模块包括目标模板和搜索区域的图注意力结构图,搜索区域的图注意力结构图中的待搜索节点可以通过计算,求出其在搜索区域响应图中对应节点的位置。可以看出,每个搜索节点是通过利用来自所有邻近目标节点的信息重建的。fF和cF分别表示模板图像f和当前帧图像c的特征。视特征图由11m(m为特征通道的数量)节点构成,通过学习节点之间的关系得到目标模板特征与搜索区域特征之间的对应关系。fV 和cV 分别表
19、示包含fF 和cF 中所有节点的集。构建一个向量(,)|,cEx yxV fyV,以探求两个节点集之间的关系。30 国防科技 2023 年第 3 期(总第 340 期)图2 基于图注意力机制的局部特征匹配模块的具体结构 对于每一个(,)p qE,设pqe为节点cpV和节点fqV之间的注意力值,注意力网络a与两个节点均有关系,表示如下:(,)pqpqcfeahh(1)式中,pch和qfh是节点p和节点q的特征向量。当两个节点越相似时,说明该搜索特征与目标特征越相似,该位置越有可能代表目标点。因此,将为相似度高的节点设置更高的注意力值。从简便计算的角度出发,使用内积计算对相似度做如下简化:(,)(
20、)()pqpqcfccffahhW hW h(2)式中,cW和fW是线性映射矩阵。对注意力值进行归一化,得到:exp()softmax()exp()fpqpqpqpnn Veaee(3)式中,pqa表示目标模板特征中的q节点对搜索区域特征中的p节点的关注度。图注意力机制的展开模型如图3所示。通过加权求和,将新的搜索特征表示为:ReLU()fpqcpqvfq VahW h(4)式中,vW是线性映射矩阵。计算所有的pch(cpV),可以得到搜索图像的响应图。图注意力机制的计算流程示意如图4所示。图3 图注意力机制的展开模型 图4 图注意力机制的计算流程示意 图4中不同的箭头样式表示独立的注意力计算
21、。图注意力机制将每个头部的聚集特征求取平均,以获得新的搜索特征1h。传统的互相关算法仅使用了第一帧图像的中心区域作为目标模板,这意味着将大量背景信息融入了模板中。当目标的长宽比很大 师晓冉,等:基于图注意力机制的无人机目标红外跟踪技术 31 时,该算法对于目标的特征提取是不利的。因此,此处对输入到图注意力中的第一帧图像的特征fF进行了处理,提出了一种在模板补丁中标记的边界框fB监督下的目标感知模板特征区域选择机制。将fB投影到特征图fF上,可以获得感兴趣的区域fR。只有fR中的像素被视为模板特征:(,),:fffi jRFFi j(5)通过以上操作,获得的特征映射fF是尺寸张量(,)w h c
22、,其中w和h对应模板边界框fB的宽度和高度,c是fF的通道数。每个元素,:fFi j被视为模板子图fV中的一个节点。同时,每个元素(,:)cF m n被视为搜索子图cV中的一个节点。这两个子图作为图注意模块的输入,用于信息嵌入。由于fV中的元素在特征图fF上以网格模式排列,故可以用11卷积实现式(5)的线性变换。然后,通过矩阵乘法计算所有相关分数,这有望大幅提高效率。实验发现,在每次卷积后使用批量的归一化可以有效改善算法性能。然而,由于无法预先确定不同跟踪对象对应的尺寸w和h,因此无法直接使用比例变量fF进行批量归一化操作。为了解决这个问题,重新计算fF:,0,ffFF标节点节点框中包含目的其
23、他(6)目标节点的数量不是固定的,而是通过目标感知区域选择机制随着不同的目标模板而变化。也就是说,算法只选取目标所在真值框中的目标特征,将超出目标真值框的特征设置为0。在此简单处理后,可以大幅度过滤冗余的背景信息,在不损失目标信息的情况下,适应不同尺度的无人机目标。之后,为了适配图注意力,需要设计一个保证效率的同时提高深度特征提取能力的特征提取网络。同时,由于局部跟踪精度较高,但抗跟踪丢失能力较差,需要以双阶段结构的全局重检测功能对其进行补充,因此,需要设计一个切换策略,实现算法局部/全局跟踪自适应切换。1.3 改进MobileNetV2的特征提取网络模块构建 红外图像中无人机目标较为弱小,深
24、层特征信息易被复杂背景湮没。为适配图注意力,特征提取阶段要在保证效率的同时,尽量提高目标特征提取的深度和精细度。同样为双阶段结构的SiamR-CNN使用AlexNet神经网络作为特征提取网络,但其网络的深度较浅,难以提取更深层次的目标特征。相较AlexNet、VGG9和Resnet10等特征提取网络,MobileNetV2网络的参数量少且运算速度较快,可以在一定程度上弥补双阶段跟踪网络在跟踪速度上的缺陷,因此,选择MobileNetV2作为GASiam算法的特征提取网络。MobileNetV2保留了MobileNetV1中的深度可分离卷积,并在此基础上增加了线性瓶颈模块和倒残差模块,前者取代了
25、原有的ReLU非线性激活,减少了非线性计算对信息的破坏;后者与残差块类似,但深度卷积层的特征提取能力受输入特征维度限制,使用残差块会降低网络所能提取特征的能力。由此,MobileNetV2网络通过逐点卷积对特征图通道进行扩张,以丰富特征数量,从而提高精度。残差块与倒残差块的对比如图5所示。由于MobileNetV2的整体步长为32,这就导致网络最终提取出的目标特征图分辨率过低,只有77 pt。根据前面的分析,无人机目标边界框平均值近似30 pt,过低像素的特征图不利于之后孪生网络的信息嵌入,因此需要对MobileNetV2网络结构进行修改。此外,该网络为目标检测的特征提取网络,在进行目标跟踪时
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 注意力 机制 无人机 目标 红外 跟踪 技术
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。