分销赏收藏举报申诉 / 11

立即下载开通VIP

当前位置：首页 > 学术论文 > 论文指导/设计 > 基于边缘增强和特征融合的伪装目标分割.pdf

基于边缘增强和特征融合的伪装目标分割.pdf

上传人：自信****多点

文档编号：3010083

上传时间：2024-06-13

格式：PDF

页数：11

大小：4.55MB

《基于边缘增强和特征融合的伪装目标分割.pdf》由会员分享，可在线阅读，更多相关《基于边缘增强和特征融合的伪装目标分割.pdf（11页珍藏版）》请在咨信网上搜索。

1、第 39 卷第 1 期2024 年 1 月Vol.39 No.1Jan.2024液晶与显示Chinese Journal of Liquid Crystals and Displays基于边缘增强和特征融合的伪装目标分割李明岩1，2，吴川1，2*，朱明1，2（1.中国科学院长春光学精密机械与物理研究所，吉林长春 130033；2.中国科学院大学，北京 100049）摘要：伪装目标分割的任务是使用像素级分割掩码将与背景高度相似的目标进行准确分类和定位，与传统的目标分割任务相比更具挑战性。针对目标与周围环境高度相似、边界模糊、对比度低等问题，构建了一种基于边缘增强和特征融合的伪装目标分割方法

2、。首先，设计了一组边缘提取模块，能够更准确地分割有效的边缘先验。之后，引入了多尺度特征增强模块和跨层级特征聚合模块，分别挖掘层内与层间的多尺度上下文信息。提出了一种简单的层间注意力模块，利用相邻层级间的差异有效滤除融合后存在的干扰信息。最后，通过将各级特征图与边缘先验逐级结合的方式，获得准确的预测结果。实验结果表明，在 4个伪装目标基准数据集上，该模型的表现都优于其他算法。其中加权 F值提升了 2.4%，平均绝对误差减少了 7.2%，在 RTX 2080Ti硬件环境下分割速度达到了 44.2 FPS。与现有方法相比，该算法能够更准确地分割伪装目标。关键词：深度学习；伪装目标；图像分割；边缘特征

3、；特征融合中图分类号：TP391.4 文献标识码：A doi：10.37188/CJLCD.2023-0064Camouflaged object segmentation based on edge enhancement and feature fusionLI Mingyan1，2，WU Chuan1，2*，ZHU Ming1，2（1.Changchun Institute of Optics，Fine Mechanics and Physics，Chinese Academy of Sciences，Changchun 130033，China；2.University of Chin

4、ese Academy of Sciences，Beijing 100049，China）Abstract：The task of camouflaged object segmentation is to accurately classify and localize objects that are highly similar to the background using pixel-level segmentation masks，which is more challenging than traditional object segmentation tasks.Aiming

5、at the problems that the target is highly similar to the surrounding environment，the boundary is blurred，and the contrast is low，a camouflaged target segmentation method based on edge enhancement and feature fusion is constructed.First，a set of edge extraction modules is designed，aiming to accuratel

6、y segment valid edge priors.Afterwards，a multi-scale feature enhancement module and a cross-level feature aggregation module are introduced to mine multi-scale contextual information within and between layers，respectively.In addition，a simple inter-layer attention module is proposed to effectively f

7、ilter out the interference information existing after fusion by utilizing the difference between adjacent layers.Finally，accurate prediction results are obtained by 文章编号：1007-2780（2024）01-0048-11收稿日期：2023-02-20；修订日期：2023-03-20.*通信联系人，E-mail：第 1 期李明岩，等：基于边缘增强和特征融合的伪装目标分割combining feature maps of all

8、levels with edge priors step by step.Experimental results show that the model outperforms other algorithms on four camouflaged target benchmark datasets.Among them，the weighted F value increased by 2.4%，the average absolute error decreased by 7.2%，and the segmentation speed reached 44.2 FPS under th

9、e RTX 2080Ti hardware environment.Compared with existing methods，this algorithm can segment camouflage targets more accurately.Key words：deep learning；camouflaged object；image segmentation；edge feature；feature fusion1 引言伪装原本是指动物用来隐藏自己或欺骗其他动物的一种方法，而伪装能力通常会影响这些动物的生存概率。随着仿生学技术的发展，伪装技术也常被人类应用于某些场合，例如现代军

10、队所使用的迷彩。与显著目标检测（Salient Object Detection，SOD）相比，伪装目标通常与背景具有高度相似性，因此伪装目标检测（Camouflage Object Detection，COD）更加具有难度。传统的方法主要关注图像的底层特征（如颜色、纹理、梯度等）来评估物体与背景的差异，基于三维凸度1、灰度共生矩阵2、Canny 边缘检测器3、光流4等方法进行伪装目标检测。这些方法往往只考虑图像的一部分特征，难以适用于所有场景。近年来，深度学习的方法在许多领域展现出优异的性能，为一些传统方法难以处理的问题提供了新的解决方案5。在图像领域，通过卷积神经网络（Convolutio

11、n Neural Network，CNN）提取出的深度特征的表示能力要远强于图像的底层特征，因此，研究人员开始尝试用深度学习的方法来解决伪装目标分割的问题。Le 等人建立了一个新的伪装图像数据集用于基准测试，并提出了一个端到端网络，其中包括一个分割分支和另一个分类分支。分类分支用于预测图像包含伪装对象的概率，随后用于增强分割分支中的分割性能6。Fan等人提出了 SINet模型，该模型包含两个模块：搜索模块定位伪装目标，识别模块精确检测伪装目标，同时建立了首个大规模伪装目标数据集7。Mei等人在伪装目标分割任务中引入了干扰的概念，开发了一种新的干扰识别和去除的干扰挖掘方法，帮助对伪装目标的准确检

12、测8。Zhai等人将特征映射解耦为两个特定的任务：一个用于粗略地定位对象，另一个用于准确地预测边缘细节，并通过图迭代推理它们的高阶关系9。Li等人提出联合训练 SOD 和 COD 任务，利用相互矛盾的信息同时提高两个任务的表现10。以上模型在多个伪装目标数据集上已经取得了较好的效果，但仍存在一些问题：模型的全局建模能力不足，在存在多个伪装目标且与背景高度相似时，模型容易出现漏检和误检的问题。其次，这些模型舍弃了较低层次的特征，而较深层次的特征在进行数次下采样后分辨率迅速下降，虽然减少了计算量，但同时也丢失了大量的边缘等细节信息，这也导致了模型的精度下降。最后，这些模型大多使用了极其复杂的特征融

13、合策略，大幅提高了模型的复杂度与推理时间。针对以上问题，本文提出了一种基于边缘增强和多级特征融合的伪装目标分割模型。首先，选择ResNet-50作为骨干网络，提取多级深度特征。其次，设计了一个边缘提取模块，选择融合细节信息丰富的两个较低层级特征，通过网络的不断学习，得到精确的边缘先验。同时，通过引入多尺度特征增强模块和跨层级特征聚合模块，分别在层内和层间增强特征表示，弥补多尺度表征能力不足的问题。之后，设计了一种简单但有效的层间注意力模块，利用相邻层的差异性，有选择地筛选出各层级间有用的信息，在保持层内语义完整的同时滤除背景噪声，再与边缘先验引导结合，输出精确的预测图。最后，为了增强网络的学习

14、能力，本文采用加权二元交叉熵损失与加权IOU（Intersection-Over-Union）损失两部分作为损失函数，对 3 个不同尺度的输出预测同时进行深度监督；采用单独的加权二元交叉熵损失对边缘预测图进行监督，边缘的真值可以使用 Canny 边缘检测方法从标注图中得到。本文方法在 4个伪装目标公开数据集 CHAMELEON11、CAMO6、COD10K7、NC4K12上与先进的方法进行对比实验。实验结果表明，本文方法在所有数据集的49第 39 卷液晶与显示4 个常用的评价指标上均优于其他方法，同时能够满足实时性的需要，表明本文方法在伪装目标分割任务上具有优异的性能。2 本文方法如图 1所示

15、。对于一幅输入图像I RH W 3（其中H为图像高，W为图像宽，通道数为 3），采用 ResNet-50 作为特征提取网络13，获得不同尺度的特征fi，i 1，2，3，4，5。首先，使用一个边缘提取模块来显式地建模边缘特征，以此指导网络学习并提升检测性能。然后，将获得的多级特征通过多尺度特征增强模块（Multi-scale Feature Enhanced Module，MFEM）筛选出更具辨识度的特征。增强后的特征图每 3 个层级为 1 组，同时输入到跨层级特征聚合模块（Cross-level Fusion Module，CFM），有选择地结合不同尺度下的有效特征。通过注意力模块给有价值的信

16、息以更高的权重。最后与边缘信息加以结合，得到最终的伪装目标分割预测图。2.1边缘提取模块早期的一些相关工作14-15已经证实了边缘信息有助于提升计算机视觉任务的性能。在伪装目标分割任务中，由于目标与背景的高度相似性，难以清晰地辨别伪装对象与周围环境之间的边界。现有的研究表明16，通常只有低级特征保留了大量的边缘细节信息，而在经过多个下采样操作后，细节信息会丢失。因此，本文设计了一个边缘提取模块，如图 1 所示。自 ResNet-50 中提取出最低两层的特征f1 RH4W4 64、f2 RH4W4 256，分别经过两个包含 33 卷积、批归一化（Batch Normalization，BN）及

17、ReLU 激活函数的卷积组，用来保证两组特征的通道数一致。然后通过逐元素相乘的方式得到融合的特征表示。将融合后的特征分别与卷积后的特征相加，用来抑制背景噪声和增强感兴趣区域。增强后的特征再次分别输入两个卷积组，通过拼接和一组 11卷积进行降维，得到全局边缘引导特征图fe。最后，将边缘特征图通过双线性上采样的方式恢复到与原图相同的尺寸，用来监督学习边缘表示。目标边缘的真值图可以通过对二值标注图进行 Canny边缘检测得到。Block-1Block-2Block-3Block-4Block-5MFEMMFEMMFEMMFEMMFEMCFMCFMCFMAACCCconvconvconvconvcon

18、vconvconvconv11convCfefefe11 conv11 conv11 conv多级监督f1f2边缘提取模块Block-i：ResNet-50卷积组MFEM：多尺度特征增强模块CFM：跨层级特征聚合模块fef1f2f3f4f5conv：卷积+批归一化+ReLU函数：相乘：相加C：拼接A：注意力模块标注图像：(13522)边缘监督：(13522)输入图像：(33522)图 1网络结构图Fig.1Network structure diagram50第 1 期李明岩，等：基于边缘增强和特征融合的伪装目标分割2.2多尺度特征增强模块伪装目标通常具有较大的尺度范围。每个单独的卷积层只能处

19、理一种特定的尺度，为了从单个层级获取多尺度信息以表征尺度的变化，受Inception-V317启发，设计了一个多尺度特征融合模块（MFEM），如图 2 所示。对于每个输入的特征fi，每个 MFEM 包含 4 个并联的残差支路和一个主路。在每个残差支路中，首先使用一个11 卷积将特征的通道数降为 64。接下来的两层分别为(2i-1)1和1(2i-1)大小的卷积核，i 1，2，3，4。这两层卷积的串联等效于两个(2i-1)(2i-1)大小的卷积核的串联，在不影响模块表征能力的同时能够减少计算的损耗。在支路的最后是一个膨胀率为(2i-1)，i 2，3，4 的 33 卷积层，增大感受野以捕捉细粒度特征

20、。最后，将 4 个支路的特征拼接在一起并通过卷积来保证通道数一致，拼接后的特征与主路相加后，通过 ReLU 函数来获得输出特征f i。2.3跨层级特征聚合模块在跨层级特征融合的过程中，如何有效地保持层内语义的一致性及利用层间的相关性是构建伪装目标分割网络的关键。为此，本文提出了一个跨层级特征聚合模块（CFM），如图 3所示。给定一组特征fi-1，fi，fi+1，i 2，3，4，首先将较高层的特征fi+1与中间层特征fi分别经过一个卷积组后进行逐元素相乘，其中fi+1在卷积前进行一次双线性上采样操作以保证维度大小相同。将聚合后的特征再次进行上采样与卷积操作并与较低层特征相乘，得到f i-1，f

21、i，f i+1，i 2，3，4。之后，将初步融合后的特征由较高层到较低层逐级进行拼接操作。最后，将拼接后的特征矩阵分别经过一个 33大小的卷积组和一个 11大小的卷积核，将通道数减少为原始通道数，得到最后的输出特征ffusei，i 2，3，4。整个过程定义如式（1）式（5）所示：f i+1=Conv(fi+1)，（1）f i=Conv(fi)f i+1，（2）f i-1=fi-1 Conv(f i)，（3）fci=Cat(f i-1，Conv(Cat(f i，f i+1)，（4）ffusei=Conv1(Conv(fci)，（5）其中：Conv()表示一个 2倍的双线性上采样接一个包含 33卷

22、积、批归一化和 ReLU 函数的卷积组，Cat()表示对括号内的两个元素进行拼接操作，Conv1()是一个单独的 11 卷积核。接着，将输出特征传入注意力模块进行筛选。2.4注意力模块通过简单的拼接或相加的方式融合的特征往往是复杂且低效的，大量的噪声及低置信度的信息混杂在一起会对网络的学习造成巨大的困难。为此，设计了一个简单的注意力模块，对CFM融合后的特征进一步结合并筛选，模块结构图见图 4。首先将两组相邻层级的特征fi，fi+1，i 2，3 进行卷积处理，再分别通过一个 11卷积将通道维度由 C降为 1。即：f1 h wi=Conv1(Conv(fc h wi)，（6）其中：h、w分别表示

23、特征的高度、宽度两个维度的大小，c为通道数。将处理后的矩阵拼接并在通道维度上进行 Softmax 函数计算，可以得到两个不同的权重矩阵1 h w1、1 h w2。将两个权重矩阵分别与对应的特征图相乘，可以得到：f()x，y i=f()x，yi ()x，y1，（7）f()x，y i+1=f()x，yi+1 ()x，y2，（8）f(x，y)表示该特征矩阵上对应于(x，y)位置的元convconvCCconvconvconv11 convfi-1UpUpfifi+1Upfifusefifi-1fi+1图 3跨层级特征聚合模块Fig.3Cross-level fusion module11 convC

24、11 conv11 conv13 conv31 conv33 conv(膨胀率=3)11 conv15 conv51 conv33 conv(膨胀率=5)11 conv17 conv71 conv33 conv(膨胀率=7)f1fifi图 2多尺度特征增强模块Fig.2Multi-scale feature enhanced module51第 39 卷液晶与显示素。其中(x，y)1+(x，y)2=1，值越大，表示该位置的信息越应该被保留，反之则被舍去。最后，将两个特征相加，并经过卷积平滑操作，得到最终的输出结果：pi=Conv(f i+f i+1).（9）采用这种注意力机制可以有效地筛选出各

25、级特征中更有效的信息，抑制噪声，增强不同尺度特征的表示能力。需要注意的是，由于f4是由较高 3 个层的特征聚合得到，在卷积的过程中已经被过滤掉了大量的细节和噪声信息，因此将f4不经过注意力机制筛选而直接输出，即：p4=f4.（10）最后，将p2、p3、p4分别与全局边缘引导fe拼接，经过 11卷积降维后，上采样回原图尺寸，得到最终的预测图P2、P3、P4。其中P2作为最终的预测结果用来评估网络性能。2.5损失函数在伪装目标分割过程中，使用了加权二元交叉熵损失18（weighted binary cross entropy loss，wBCE）及加权交并比损失18（weighted inters

26、ection-over-union loss，wIOU）两部分作为损失函数。加权二元交叉熵函数的公式如式（11）所示：LwBCE=-i=1Nwi yi log zi+(1-yi)log(1-zi)，（11）其中：yi是二元标签 0 或 1，zi为输出属于yi标签的概率，wi为权重向量。加权交并比损失的公式如式（12）所示：LwIOU=1-|P G|P G，（12）其中：P为预测值，G为真实标注值。两种损失函数分别计算全局损失和像素级损失。与标准的损失函数不同，加权损失更侧重于给较难的像素更大的权重，而不是给每个像素相同的权重。基于上述分析，使用联合损失函数对P2、P3、P4 3个预测图及边缘预

27、测图fe进行深度监督。整体的损失函数可以表示为：L=1Ledge+2Lpred，（13）Ledge=LwBCE(fe，Eg)，（14）Lpred=i 2，3，4 LwBCE()pi，pg+LwIOU()pi，pg，（15）其中：Eg表示边缘标注值，可以通过对二元标注图进行 Canny 边缘检测得到。pg表示二元标注图。没有对边缘使用LwIOU损失函数监督是因为边缘预测图的前景区域与背景区域差别过大，可能导致损失函数下降不稳定。1和2用来平衡两个不同损失函数对整体损失的贡献，其中1设置为 5，2设置为 1。3 实验与分析3.1数据集我们在 4个通用的伪装目标标准数据集上进行实验：CHAMELEO

28、N11是一个小样本的伪装目标数据集，其中包含 76 张图像，每张图像至少有一个伪装目标；CAMO6 包含 1 000张用于训练的图像和 250 张用于测试的图像，数据集涵盖了大量自然及人工场景下的伪装目标；COD10K7是迄今为止最大的基准数据集，它包含 5 个大类和 69个子类，共有 3 040张训练图像和 2 026张测试图像；NC4K12是规模最大的伪装目标测试数据集，包含 4 121张图像，可用来评估模型的泛化能力。仿照之前的工作7，本文将 CAMO 的训练集和 COD10K 的训练集结合，作为完整的训练数据集（其中包含 4 040 张图片），并在余下的数据集上测试模型的性能。3.2评

29、价指标本文使用了 4 个广泛使用的评价指标：结构 conv11 convCconv11 convSoftmaxconv12fipifi+1fifi+1图 4层间注意力模块Fig.4Cross-layer attention module52第 1 期李明岩，等：基于边缘增强和特征融合的伪装目标分割性度量（S）19、E 指标（E）20、带权重的 F 指标（Fw）21及平均绝对误差（MAE）22。结构性度量（S）评估预测结果及标注图像之间的区域级和对象级结构相似性，如式（16）所示：S=So(P，Pg)+(1-)Sr(P，Pg)，（16）其中，So和Sr分别表示对象级和区域级的结构相似性。根据其他

30、研究中的经验19，这里的设置为 0.5。E指标（E）使用一个矩阵（FM）联合计算图像级的统计信息和像素级的匹配信息，可以同时衡量预测的整体完整性和局部精确性，如式（17）所示：E=1w hx=1wy=1hFM()x，y，（17）其中：w表示图像宽度，h表示图像宽。带权重的F指标（Fw）定义一个加权精度（Pw）和加权召回率（Rw）来衡量预测的准确性和完整性：Fw=(1+2)Pw Rw2 Pw+Rw，（18）其中，2是一个平衡系数，根据其他研究中的经验21，2设置为 0.3。平均绝对误差（MAE）用来衡量预测结果与标注图像之间的像素级差异，其被广泛应用于各类分割任务：MAE=1w hx=1wy=1

31、h|P()x，y-Pg()x，y.（19）为了进行公平的对比，我们使用相同的代码，对不同数据集的 4种评价指标进行计算。3.3实验细节本文模型基于 Pytorch框架构建，在 NVIDIA GeForce RTX 2080TiGPU上进行所有实验。使用在 ImageNet上预训练的权重文件初始化 ResNet-50 骨干网络的参数，其他参数由网络默认生成。在训练之前，所有训练图像及标注图像均被调整为352352大小，并且不使用任何数据增强策略。批量大小设置为 8 并在训练过程中使用了 Adam优化器，初始的学习率设置为 1e-4，并且每 30次迭代后，学习率除以 10，网络共训练 60 轮，大

32、约需要 5.5 h。在测试过程中，测试图像同样被调整为 352352大小，随后输入网络。预测图通过双线性上采样操作缩放到原始大小以评估结果。3.4实验结果及对比将本文方法与现有的 11种 COD 方法进行比较，包括 BASNet23、EGNet24、CPD16、F3Net18、PraNet25、SINet7、PFNet8、C2FNet26、SINetV227、LSR12、UGTR28。为了公平比较，我们直接使用作者在网络上开源的预测图，用相同的公式进行评估。如果缺少预测图，则使用作者提供的预训练完成的模型生成预测图。本文总结了在 4个数据集上不同基线模型的定量结果。从表 1 可以看出，本文方法

33、在不同的数据集上都优于其他模型。为了进行更广泛的对比，本文使用在目标检测领域的YOLOv5模型进行分割对比实验。在训练开始前，所有图片参照官方代码库（https：/github.(a)原始图像(a)Original image(b)标注(b)Ground truth(c)本文方法(c)Our method(d)EGNet(d)EGNet(e)SINet(e)SINet(f)PraNet(f)PraNet(g)LSR(g)LSR(h)MGL-R(h)MGL-R(i)PFNet(i)PFNet(j)SINet-V2(j)SINet-V2(1)(2)(3)(4)(5)(6)(7)图 5本文方法与其他

34、方法的视觉对比Fig.5Vision comparison of our method with other methods53第 39 卷液晶与显示com/ultralytics/yolov5）的设置被重新调整为640640 大小，其他参数使用默认设置。实验选取与本文方法参数量相近的 YOLOv5m-seg 模型（22.67M）与性能最优的 YOLOv5x-seg 模型，结果见表1。本文方法在模型大小相近的情况下性能远远领先 YOLOv5m-seg 模型，与 YOLOv5x-seg模型相比有着巨大的优势。图 5展示了本文方法与其他模型的视觉对比结果。可以看出，在不同的具有

35、挑战性的场景下（第 12 行大尺寸伪装目标，第 34 行小伪装目标，第 56行模糊边缘），本文方法都能产生优于其他模型的预测图。在目标被部分遮挡的情况下（第 7 行），该方法也能准确定位目标区域并产生精确的边缘细节。因此，本文方法相比于其他方法在伪装目标分割任务中具有更优秀的性能。另外，本文提供了本文方法与其他 11 种模型的P-R曲线和 F曲线，如图 6所示。本文方法与其他方法在模型复杂度、参数量和实时性上也进行了对比。所有算法在相同的硬件环境下（RTX2080Ti显卡）进行实验。其中表 1不同模型在 4个数据集（CHAMELEON，CAMO-test，COD10k-test，NC4K）上对

36、 4种评价指标的定量结果Tab.1Quantitative results of different models for four evaluation metrics on four dataset（CHAMELEON，CAMO-test，COD10k-test，NC4K）基线模型BASNetEGNetCPDF3NetPraNetSINetPFNetC2FNetSINetV2LSRUGTRYOLOv5m-segYOLOv5x-seg本文方法基线模型BASNetEGNetCPDF3NetPraNetSINetPFNetC2FNetSINetV2LSRUGTRYOLOv5m-segYOLOv5

37、x-seg本文方法CHAMELEONS0.6870.8480.8530.8480.8600.8690.8820.8880.8880.8900.8880.8340.8510.892COD10K-testS0.6340.7370.7470.7390.7890.7710.8000.8130.8150.8040.8180.7150.7940.822E0.7210.8700.8660.9170.9070.8910.9420.9460.9420.9480.9180.8840.9020.952E0.6780.7790.7700.8190.8610.8060.8680.8900.8870.8890.8500.

38、7320.8320.890Fw0.4740.7020.7060.7440.7600.7400.8100.8280.8160.8200.7940.7670.7960.828Fw0.3650.5090.5080.5440.6290.5510.6600.6360.6800.6730.6670.5270.5900.673MAE0.1180.0500.0520.0470.0440.0440.0330.0320.0300.0300.0310.0450.0420.027MAE0.1050.0560.0590.0510.0450.0510.0400.0360.0370.0370.0350.0480.0440.

39、034CAMO-testS0.6180.7320.7260.7110.7690.7510.7820.8200.8200.7870.7850.6990.7400.828NC4KS0.6950.7770.7870.7800.8220.8080.8390.8380.8400.8400.8390.7530.8020.850E0.6610.7680.7290.7800.8240.7710.8520.8640.8820.8520.8590.7110.7890.889E0.7850.8640.8520.8480.8770.8760.8920.8980.9070.9070.8920.7800.8680.908

40、Fw0.4130.5830.5500.5640.6630.6060.6950.7520.7430.6960.6860.5560.5920.817Fw0.5460.6390.6960.6560.7240.7230.7450.7620.7700.7700.7460.6340.7150.775MAE0.1590.1040.1150.1090.0940.1000.0850.0660.0700.0800.0860.0980.0870.061MAE0.0950.0750.0720.0700.0590.0580.0530.0490.0480.0480.0520.0660.0530.044注：加粗表示最好结果

41、54第 1 期李明岩，等：基于边缘增强和特征融合的伪装目标分割浮点运算次数（Floating Point Operations，FLOPs）可用来衡量算法复杂度，为 21.26G；模型参数量（Parameters，Params）为 29.47M；FPS（Frame Per Second）为44.2。为了公平比较，所有模型均使用352352的图片计算。如表 2所示，本文方法在提升准确性的同时也保证了实时性能。3.5消融实验为了验证每个模块的有效性，本文设计了一系列消融实验，对边缘提取模块、多级特征增强模块（MFEM）、跨层级特征聚合模块（CFM）、注意力模块等逐步解耦，以验证其有效性，实验结果见

42、表 3。为了验证损失函数及对应的超参数对网络性能的影响，本文对一系列不同的超参数设置进行了定量评价。基线模型选择一个类似 U-net29结构的分割网络，编码器部分为 ResNet-50网络，解码器逐级上采样并与较浅层特征结合，逐渐恢复到原尺寸。从表 3 可以看出，不同的模块对模型的性能提升都有贡献：在 U-net 架构基础上加入多尺度特征增强模块和跨层级特征聚合模块后，模型的4个评价指标S、E、Fw、MAE分别提升了 4.8%、3.5%、15.7%、11.1%，证明模型的层内和层间多尺度特征表达能力有了一定加强；在此基础上加入边缘提取模块，4 个指标进一步提升了 1.6%、1.8%、4.2%、

43、10%，说明边缘先验信息在该分割任务中做出了重要的贡献；在加入注意力模块后，S、E、Fw分别提升了 0.006、0.018、0.007，MAE指标则下降了 0.002。图 7为逐步解耦各个子模块后的可视化效果对比。从图 7（d）可以看出，在去除了边缘提取模图 610种不同方法在 4个基准数据集上的 P-R曲线和 F曲线，本文方法为红色实线。P-R曲线越接近右上角，F曲线越接近坐标系上部，表示模型的性能越好。Fig.6P-R curves and F-measure curves of 10 different methods on four benchmark datasets.Our met

44、hod is shown with a solid red line.The closer the P-R curve is to the upper right corner and the higher the F-measure curve is，the better the performance of the model is.表 2不同模型的速度和模型复杂度分析Tab.2Speed and model complexity analysis on multiple modelsMethodFLOPs/GParams./MFPS本文方法21.2629.4744.2SINet38.04

45、48.9556PFNet19.0049.5062UGTR1 02448.8718MGL-R549.6263.5812LSR66.6450.9556SINetV231.2624.932555第 39 卷液晶与显示块后，预测结果的边界存在大量的冗余，一些较复杂的边缘结构难以被清晰地分割，说明边缘提取模块对目标边界像素的提纯至关重要。多尺度的特征更有利于定位复杂场景下的伪装物体，在分别去掉多尺度特征增强模块（图 7（e）和跨层级特征聚合模块（图 7（f）后，模型不能准确地找到目标所在的位置，出现了目标区域模糊不清、目标结构被错判和伪装区域连通性的问题。从图 7（c）和图 7（g）可以看出，注意力模块

46、对融合后的特征进一步去噪，使网络更关注于预测目标区域，对背景区域进行抑制，目标细节更明显，置信度较低的噪声干扰被去除。为了分析联合损失函数各参数对网络的影响，按照不同的比例设置两部分损失函数的超参数（其中1为边缘损失Ledge的比重，2为预测损失Lpred的比重），进行对比实验。根据表 4，模型在给边缘损失较大权重时表现更好，在1=5、2=1时效果最好。这表明在网络不变的情况下，准确的边缘先验能够极大地提升网络的有效性。4 结论本文提出了一种基于边缘增强和特征融合的表 3不同模块的有效性分析Tab.3Effectiveness analysis of different modules边缘提取

47、模块多尺度特征增强模块跨层级特征聚合模块注意力模块COD10K-testS0.7660.8030.8120.8120.8190.8160.822E0.8280.8570.8640.8680.8750.8720.890Fw0.5520.6390.6600.6520.6640.6660.673MAE0.0450.0400.0380.0380.0360.0360.034注：加粗表示最好结果表 4两种损失函数的比重对网络性能的影响Tab.4Effect of the proportion of the two loss functions on network performance112510112

48、111125COD10K-testS0.8130.8200.8220.8250.8070.800E0.8870.8900.8900.8840.8780.871Fw0.6600.6690.6730.6700.6620.654MAE0.0360.0340.0340.0350.0350.037注：加粗表示最好结果(a)原始图像(a)Original images(b)标注(b)Ground truth(c)本文方法(c)Ours(d)去除边缘引导(d)Remove edge guidance(e)去除MFEM(e)Remove MFEM(f)去除CFM(f)Remove CFM(g)去除注意力模块(

49、g)Remove attention module图 7去除不同模块的视觉比较Fig.7Vision comparison of removed different modules56第 1 期李明岩，等：基于边缘增强和特征融合的伪装目标分割伪装目标分割网络。首先设计了一种边缘提取模块，有效利用低级特征，产生精确的边缘先验。其次，采用多尺度特征增强模块和跨层级特征融合模块，分别提取层内和层间的有效多尺度信息。之后，设计了一种简单有效的层间注意力模块，对充分融合的特征进行再次筛选，去除冗余的背景噪声干扰。最后，将各层预测与边缘先验结合，生成最后的预测图，并采用联合损失函数对不同尺度的预测图进行联

50、合监督。本文方法在4个伪装目标基准数据集上进行实验，在4种不同的评价指标上都优于其他方法。在视觉对比中，本文方法分割出的预测图能够更好地识别复杂场景下的伪装物体，更好地保留了目标轮廓，细节信息更清晰。因此，本文方法对伪装目标分割有更好的效果。参考文献：1 PAN Y X，CHEN Y W，FU Q，et al.Study on the camouflaged target detection method based on 3D convexity J.Modern Applied Science，2011，5（4）：152-157.2 HARALICK R M，SHANMUGAM K，DIN

下载提示：咨信网仅提供存储空间/不修改/不编辑

【自信AI创作助手】【自信AI导航】
1、请仔细预览页面，基本判断完整性，对于直接下载带来的问题请及时与客服沟通；下载的文档，不会出现我们的网址水印。
2、该文档所得收入（下载+内容+预览）归上传者、原创作者；如果您是本文档原作者，请点此认领！既往收益都归您。

同意并开始全文预览

举报此文档有问题？有机会获“体验VIP”奖励！

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

10 金币 0人已下载

申诉本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请申请举报、认领或删除 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 基于边缘增强特征融合伪装目标分割

咨信网温馨提示：
1、咨信平台为文档C2C交易模式，即用户上传的文档直接被用户下载，收益归上传人（含作者）所有；本站仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿，我们不确定上传用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的版权、权益或隐私，请联系我们，核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据，平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺，下载前须认真查看，确认无误后再购买，务必慎重购买；若有违法违纪将进行移交司法处理，若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传，付费前请自行鉴别，如您付费，意味着您已接受本站规则且自行承担风险，本站不进行额外附加服务，虚拟产品一经售出概不退款（未进行购买下载可退充值款），文档一经付费（服务费）、不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印，是因预览和防盗链等技术需要对页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有水印标识（原文档上传前个别存留的除外），下载后原文更清晰；试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓；PPT和DOC文档可被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；PDF文档不管是原文档转换或图片扫描而得，本站不作要求视为允许，下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用；网站提供的党政主题相关内容(国旗、国徽、党徽－－等)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
6、文档遇到问题，请及时私信或留言给本站上传会员【自信****多点】，需本站解决可联系【微信客服】、【 QQ客服】，若有其他问题请点击或扫码反馈【服务填表】；文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“【版权申诉】”（推荐），意见反馈和侵权处理邮箱：1219186828@qq.com；也可以拔打客服电话：4008-655-100；投诉/维权电话：4009-655-100。