分销赏收藏举报申诉 / 12

立即下载开通VIP

当前位置：首页 > 学术论文 > 论文指导/设计 > 基于遥感图像道路提取的全局指导多特征融合网络.pdf

基于遥感图像道路提取的全局指导多特征融合网络.pdf

上传人：自信****多点

文档编号：2356851

上传时间：2024-05-28

格式：PDF

页数：12

大小：4.70MB

《基于遥感图像道路提取的全局指导多特征融合网络.pdf》由会员分享，可在线阅读，更多相关《基于遥感图像道路提取的全局指导多特征融合网络.pdf（12页珍藏版）》请在咨信网上搜索。

1、DOI:10.3785/j.issn.1008-973X.2024.04.005基于遥感图像道路提取的全局指导多特征融合网络宦海1，盛宇2，顾晨曦1(1.南京信息工程大学人工智能学院，江苏南京210044；2.南京邮电大学集成电路科学与工程学院，江苏南京210003)摘要：在遥感图像中，建筑与道路的类间相似度高，且存在阴影和遮挡，使得现有深度学习语义分割网络在分割道路时误分割率高，为此提出全局指导多特征融合网络(GGMNet)用于提取遥感图像中的道路.将特征图分为若干个局部特征，再将全局上下文信息与局部特征相乘，强化各类别特征的提取，以降低网络对道路周边相似地物的误判率.采用融合多阶段特征的方

2、法准确定位道路空间，降低将其余地物识别为道路的概率.设计自适应全局通道注意力模块，利用全局信息指导局部信息，丰富每个像素的上下文信息.在解码阶段，设计多特征融合模块，充分利用并融合骨干网络 4 个阶段的特征图中的位置信息与语义信息，发掘层与层之间的关联性以提升分割精度.使用 CITY-OSM 数据集、DeepGlobe 道路提取数据集和 CHN6-CUG 数据集对网络进行训练和测试.测试结果表明，GGMNet 具有优秀的道路分割性能，降低道路误分割率的能力比对比网络强.关键词：遥感图像；深度学习；道路提取；注意力机制；上下文信息中图分类号：TP751.1文献标志码：A文章编号：1008973X

3、（2024）04069612Global guidance multi-feature fusion network based onremote sensing image road extractionHUANHai1,SHENGYu2,GUChenxi1(1.School of Artificial Intelligence,Nanjing University of Information Science and Technology,Nanjing 210044,China;2.School ofIntegrated Circuit Science and Engineering,N

4、anjing University of Posts and Telecommunications,Nanjing 210003,China)Abstract:Duetothehighsimilaritybetweenbuildingsandroadsinremotesensingimages,aswellastheexistenceofshadowsandocclusion,theexistingdeeplearningsemanticsegmentationnetworkgenerallyhasahighfalsesegmentationratewhenitcomestoroadsegme

5、ntation.Aglobalguidemulti-featurefusionnetwork(GGMNet)wasproposedforroadextractioninremotesensingimages.Toreducethenetworksmisjudgmentrateofsimilarfeaturesaroundtheroad,thefeaturemapwasdividedintoseverallocalfeatures,andthenthefeaturesweremultipliedbytheglobalcontextinformationtostrengthentheextract

6、ionofvariousfeatures.Themethodofintegratingmulti-stagefeatureswasusedtoaccuratespatialpositioningofroadsandreducetheprobabilityofidentifyingothergroundobjectsasroads.Anadaptiveglobalchannelattentionmodulewasdesigned,andtheglobalinformationwasusedtoguidethelocalinformation,soastoenrichthecontextinfor

7、mationofeachpixel.Inthedecodingstage,amulti-featurefusionmodulewasdesignedtomakefulluseofthelocationinformationandthesemanticinformationinthefeaturemapofthefourstagesinthebackbonenetwork,andthecorrelationsbetweenlayerswereuncoveredtoimprovethesegmentationaccuracy.ThenetworkwastrainedandtestedusingCI

8、TY-OSMdataset,DeepGlobeRoadextraction dataset and CHN6-CUG dataset.Test results show that GGMNet has excellent road segmentationperformance,andtheabilitytoreducethefalsesegmentationrateofroadsegmentationisbetterthancomparingnetworks.Key words:remotesensingimage;deeplearning;roadextraction;attentionm

9、echanism;contextinformation收稿日期：20230320.网址： Gabor 滤波器3、Sobel 算子4、分水岭算法5等，还有较先进的机器学习方法，如支持向量机6（supportvectormachine,SVM）和随机森林7（randomforests,RF）.这些方法通过提取遥感图像中的特征，如纹理、边缘、形状等，进行图像分割从而实现目标提取.在遥感图像中，道路表现为具有连通性的狭窄线条，有些线条覆盖整幅图像且多条道路可能存在交叉连通，待提取的特征复杂且丰富，干扰也较多，因此传统的图像分割方法很难用于道路提取.深度学习技术在计算机视觉研究领域发展迅速，该方法自动获

10、取图像的非线性和层次特征，可以更好地解决其他道路提取方法存在的问题.语义分割是深度学习在图像分割领域中的主要研究方向，它能较全面地利用卷积神经网络（convolutionalneuralnet-works,CNNs）8从输入图像中提取图像的浅层和深层特征，实现端到端的像素级图像分割，具有较高的分割精度和效率.学者针对高分辨率的道路图像提取提出的深度学习研究方法不少，但类间相似度高、噪声干扰多、狭窄道路难提取等难点仍有待克服9.Long等10提出不包含全连接层的全卷积网络（fullyconvolutionalnetworks,FCN）.FCN 将 CNN 最后的全连接层替换为卷积层，称为反卷积，

11、利用反卷积对最后一个卷积层的特征图进行上采样，使最后一个卷积层恢复到输入图像相同的尺寸，在预测每个像素的同时保留空间信息.FCN 可以适应任意尺寸输入图像，并且通过不同层之间的跳跃连接同时确保了网络的鲁棒性和精确性，但是FCN 不能充分提取上下文信息，语义分割精度较差.基于 FCN 改进的 U-Net11采用编解码的网络结构，它可以充分利用像素的位置信息，在训练集样本较少时仍可保持一定的分割精度.残差神经网络（deepresidualnetworks,ResNet）12避免了因增加网络深度造成的模型过拟合、梯度消失和梯度爆炸问题，被广泛应用于特征提取网络中.Zhao 等13提出的金字塔场景解析

12、网络（pyramidsceneparsingnetwork,PSPNet）使用金字塔池化模块，Chen 等14提出的 DeepLabV3+网络使用空洞空间金字塔池化（atrousspatialpyramidpooling,ASPP）获取并引入解码模块恢复便捷信息，这2 个网络均提取多尺度的语义信息进行融合，提高了分割精度,但它们只关注宏观的空间位置信息，对细节方面的信息关注不足.注意力机制使神经网络具备专注于输入图像的某些重点部分的能力.Hu 等15提出挤压激励网络（squeeze-and-excitationnetworks,SE-Net），将通道注意力机制加入主干网，提升了特征提取的效率.

13、Woo 等16提出卷积块注意模块（convolu-tionalblockattentionmodule,CBAM），此模块将全局最大池化加入 SE 模块，同时引入空间注意力机制，有效地提取了特征图内的位置相关信息.Fu 等17提出的双重注意网络（dualattentionnet-work,DANet）使用 2 种类型的注意力模块，分别模拟空间维度和通道维度中的语义相互依赖性，通过对局部特征的上下文依赖关系进行建模，显著改善了分割结果.Zhang 等18提出上下文先验网络移动语义分割的令牌金字塔转换器，设计金字塔形式的视觉转换器，平衡了分割精度与速度，减少了数据量，完成了困难样本的较快速分割.在

14、分割道路时使用现有的语义分割网络的效果欠佳，为此本研究提出全局指导多特征融合网络（globalguidemulti-featurefusionnetwork，GGMNet），并应用于遥感图像的道路提取.GGMNet 包含自适应全局通道注意力模块（adaptiveglobechannelattentionmodule,AGCA）和多特征融合模块（multi-featurefusionmodule，MFM）.1数据集采用 3 个数据集进行训练与测试，分别为CITY-OSM 数据集19、DeepGlobe 道路提取遥感地图数据集20和 CHN6-CUG 数据集21.CITY-OSM 数据集使用柏林和

15、巴黎的谷歌地图高分辨率 RGB 正射影像，共有 825 幅图像，每幅图像为26112453 像素.按照 41 的比例随机抽取，其中660 幅图像作为训练集，剩余 165 幅图像作为测试集.CITY-OSM 数据集有背景、建筑物和道路 3 个第4期宦海,等：基于遥感图像道路提取的全局指导多特征融合网络 J.浙江大学学报：工学版,2024,58(4):696707.697类别.DeepGlobe 道路提取遥感地图数据集共有6226 幅遥感图像，每幅图像为 15001500 像素，按照 41 的比例随机抽取，其中 4981 幅图像作为训练集，剩余 1245 幅图像作为测试集.该数据集的图像拍摄于泰国

16、、印度、印度尼西亚等地，图像场景包括城市、乡村、荒郊、海滨、热带雨林等，数据集有道路和背景 2 个类别.CHN6-CUG 数据集是中国代表性城市大尺度卫星影像数据集，遥感影像底图来自谷歌地球.在该数据集中，根据道路覆盖的程度，标记道路由覆盖道路和未覆盖道路组成；根据地理因素的物理角度，标示道路包括铁路、公路、城市道路和农村道路等.CHN6-CUG数据集共有 4511 幅遥感图像，每幅图像为 512512 像素，按照 41 的比例随机抽取，其中 3608 幅图像作为训练集，剩余 903 幅图像作为测试集.2全局指导多特征融合网络2.1 网络的整体结构F1、F2、F3、F4GGMNet 的整体结构

17、如图 1 所示.网络的主干部分采用 ResNet-50-C22来提取输入图像的特征.网络保留阶段 Res-1Res-4 的 4 个结果，并对 Res-2Res-4 的结果进行上采样，获得 3 个与 Res-1 结果的尺度相同的结果，分别为.将Res-4 的结果输入 ASPP，以提取深层特征图中的F1、F2、F3、F4MFF1、F2、F3、F4全局信息和多尺度信息.再将 ASPP 的输出作为AGCA 的输入，利用 AGCA 提取特征图的类别信息.对 AGCA 的结果进行上采样并与之前的 4 个结果进行融合，得到多层特征（multi-layerfeatures,MF）.分别将与作为 MFM 的输入

18、，得到 4 个结果，分别为.融合这 4 个结果并进行上采样，得到最终的分割结果.2.2 自适应全局通道注意力模块影响道路分割精度的主要原因在于网络将与道路类似的类别错误识别为道路，降低了道路的交并比（intersectionoverunion，IoU）.道路周边的像素对道路影响很大，充分提取道路及其周边的局部信息可以提高分割精度从而降低误分割率.本研究设计全局通道注意力模块，模块针对每个像素的上下文信息，从全局入手，指导局部信息的权重，在保证类别准确的同时，提高每条道路目标的位置准确率.XXcmXcmAGCA 的整体结构如图 2 所示.在上分支，对输入特征图进行全局平均池化，得到全局信息的特征

19、向量，第个数据的计算式为Xcm=Fa(X)=1HWHi=1Wj=1Xm(i,j).(1)FaXmmHWHW CX11HW s2X1X1HW s2AcXssCXss2CAsHW CAAHW CXaXXaZ式中：为平均池化，为第列的所有个数据.将此向量进行维度扩展，恢复成的尺寸，再与输入特征图相加.将此结果经过卷积进行通道维度的改变，并经过 Sigmoid 激活变为的尺寸，得到.再将转化成的二维矩阵.在下分支中，将输入特征进行自适应平均池化，得到尺寸为的特征图，再将此特征图转化为的矩阵.将2 个矩阵相乘得到尺寸为的矩阵，再将转换成尺寸为的，利用残差思想，将与相加，得到自适应全局通道注意力模块的输出

20、，此过程表示为Z=X+As Ac.(2)输入Res-1Res-2Res-3Res-4ResNet-50-CASPPAGCAConcatMFMMFMMFMMFM输出Concat上采样F1F2F3F4F1F2F3F4MF图 1 全局指导多特征融合网络的整体结构Fig.1Overallstructureofglobalguidemulti-featurefusionnetwork平均池化+11 Conv扩展AcX自适应平均池化重塑As重塑A重塑Xa+XcX1XsZHWCHWCHWCHWs2HWs211CssCs2C图 2 自适应全局通道注意力模块的整体结构Fig.2Overallstructureo

21、fadaptiveglobechannelattentionmodule698浙江大学学报（工学版）第58卷XssHWs2s2HWs2s上分支的全局平均池化提取特征图的全局信息，特别是通道中的类别信息；下分支通过自适应平均池化使图像划分为个区域，每个区域包含此区域的位置信息.上分支中的全局信息将个维的向量作为权重，指导下分支的局部信息，再通过训练可以提升网络对于道路的提取能力，最终预测语义标签.当道路的信息在图像的不同位置时，它周边的地物如建筑物、河流、轨道对其影响不同，导致全局的特征对其影响的权重不一致，为此将图像分为个部分进行分割，并且包含全局信息的个权重向量分别对这个区域进行指导，为可变

22、参数，在消融实验中进行讨论，以找到最适合道路提取的取值.2.3 多特征融合模块MFMFMF深层特征和浅层特征具有不同权重的信息，浅层特征的位置信息更加丰富，深层特征的类别信息更加丰富，往往利用注意力融合模块融合深层和浅层特征.GGMNet 采用 MFM 融合 4 个层的特征图.将 4 层的特征图以及被 AGCA 处理过的第 4 次特征图进行 Concat 操作得到多层特征，此操作的目的是收集并进一步提取多层特征图的信息，使这些信息的利用率达到最高，从而提高网络的分割精度.再将 4 层的特征图通过 MFM分别与进行融合，这个融合过程使 4 层特征图中的局部信息与全局的信息进一步合并，在训练过程中

23、全局信息可以给每张特征图中的信息进行指导.最后将 4 个与融合后的特征图进行Concat 操作，结果包含丰富的位置信息与类别信息，使网络的分割结果中位置更加准确，误分割率降低.MFiFiYYMFFi11如图 3 所示为 MFM 的整体结构.将和第层的结果进行 Concat 操作，经过卷积层和批量标准化（batchnormalization，BN）层，然后经过ReLU 层进行激活.再经过 Softmax 层得到特征图，以更好地进行像素分类.将与相乘后与进行 Concat 操作，再经过卷积降维，得到多特征融合模块的输出.3结果与分析3.1 实验环境及参数设置实验在 Centos7.8 系统的 Py

24、torch 框架下完成，实验平台硬件为 IntelI9-9900KFCPU、64-GB 内存和 2 张具有 11GB 显存的 NVIDIA2080Ti 显卡，使用 Mmsegmentation 语义分割开源工具箱.训练过程使用随机梯度下降优化算法作为优化器，学习衰减策略为 Poly 学习率衰减策略，初始学习率为0.01，最低学习率为 0.0004，损失函数为交叉熵，最大迭代次数为 120000.3.2 试验评价指标平均交并比（MIoU）是语义分割领域中衡量图像分割精度的重要通用指标，是对每一类交并比求和平均的结果.IoU 为预测结果和实际结果的交集和并集之比，即分类准确的正类像素数和分类准确的

25、正类像素数与被错分类为负类的正类像素数以及被错分类为正类的负类像素数之和的比值.评价指标的计算式分别为IoU=TPTP+FP+FN，(3)MIoU=ni=1IoUn.(4)n式中：TP 为预测正确的正样本，FP 为预测错误的负样本，FN 为预测错误的负样本，为类别数.3.3 结果与分析sss3.3.1超参数的取值对比超参数的大小影响局部特征的尺寸，也影响全局特征对局部特征的指导效果.在基准网络的 ASPP 模块之后添加取不同数值的自适应全局通道注意力模块，以测试不同取值的模块性能.考虑到随机误差的影响，所有消融实验都进行 5 次重复实验，文中表格所列数据为平均值.ss=1s=4s=2s=5基于

26、 CITY-OSM 数据集设置的实验结果如表 1 所示.可以看出，添加 AGCA 后，网络的结果均有提升.在添加的模块时，道路的 IoU 提升了 0.76 个百分点，网络的 MIoU 提升了 1.31 个百分点；在添加的模块时，网络的提升达到最大，道路的 IoU 提升了 0.86 个百分点，网络的MIoU 提升了 1.95 个百分点.和时的提升较小，道路的 IoU 分别提升了 0.58 个百分点和0.21 个百分点，网络的 MIoU 分别提升了 1.38 个Concat批量标准化层卷积层ReLU 层Softmax 层Concat11ConvMFFiY图 3 多特征融合模块的整体结构Fig.3O

27、verallstructureofmulti-featurefusionmodule第4期宦海,等：基于遥感图像道路提取的全局指导多特征融合网络 J.浙江大学学报：工学版,2024,58(4):696707.699s=4百分点和 1.49 个百分点.实验结果表明，AGCA 可以帮助网络进行更精细的道路提取，对道路周边的类别识别效果有所改善，减少了误分割率；可以观察到，背景类别与建筑物类别在添加模块之后的精度也有所上升，这些提升说明道路周边的类别被识别为道路的概率也有所下降，使道路提取的准确率得到提高.实验的视觉结果对比如图 4 所示.可以看出，基准网络对于道路的识别不到位，边缘模糊，且比标签图

28、中的道路细，说明基准网络在受到道路的周围有相似地物影响时，分割性能较差.在添加 AGCA 后，道路的分割情况得到明显改善，道路的粗细更加接近标签图，且在时，道路分割最为准确，误分割率最低，与标签图最接近.这与表 1 的数据结果一致.ss=4ss=4s=4基于 DeepGlobe 数据集设置的结果如表 2所示.可以看出，所有添加 AGCA 的网络均优于基准网络.其中时，道路的 IoU=62.80%，比基准网络高 0.56 个百分点，网络的 MIoU=80.45%，比基准网络高 0.30 个百分点，结果最好.实验结果表明，当=4 时，网络具有最好的性能，全局信息对局部信息的指导最充分，分割精度最高

29、.实验的视觉结果对比如图 5 所示.由方框标识的区域可以看出，大部分添加自适应全局通道注意力模块的网络在进行道路分割时，误分割情况得到改善.的方框区域与标签图最接近，几乎没有误分割的道路，也未将背景类别识别为道路，说明当时，自适应全局通道注意力模块的效果最好，证明了模块的有效性.这与表 2 的数据结果一致.s基于 CHN6-CUG 数据集设置的结果如表 3所示.可以看出，所有添加 AGCA 的网络结果均表 1 基于 CITY-OSM 数据集的自适应全局通道注意力模块超参数取值对比Tab.1Comparisonofhyperparametervaluesforadaptiveglobechann

30、elattentionmodulebasedonCITY-OSMdataset%方法IoUMIoU背景建筑物道路基准网络83.4448.6176.3069.45s=183.8651.3677.0670.76s=283.7851.8276.8870.83s=383.7150.4377.0670.40s=484.0353.0277.1671.40s=583.6552.6476.5170.94(a)原图(b)基准网络(d)s=2(c)s=1(e)s=3(f)s=4(g)s=5(h)真实数据建筑物道路背景图 4 基于 CITY-OSM 数据集的超参数取值可视化结果对比Fig.4Comparisonof

31、hyperparameter-valuevisualizationresultsbasedonCITY-OSMdataset表 2 基于 DeepGlobe 数据集的自适应全局通道注意力模块超参数取值对比Tab.2ComparisonofhyperparametervaluesforadaptiveglobechannelattentionmodulebasedonDeepGlobedataset%方法IoUMIoU背景道路基准网络98.0662.2480.15s=198.0662.3780.22s=298.0862.5880.33s=398.1062.4580.28s=498.1062.80

32、80.45s=598.0662.4480.25700浙江大学学报（工学版）第58卷s=4ss=2、3、5s=1、4s=优于基准网络.其中时，道路的 IoU=61.94%，比基准网络高 1.81 个百分点；网络的 MIoU=79.62%，比基准网络高 0.99 个百分点，结果最好.实验结果表明，当=4 时，网络对道路的提取能力最好，精确度最高.实验的视觉结果对比如图 6 所示.可以看出，基准网络分割出的道路边缘不清晰，形状也与标签图相差较大，在添加 AGCA 之后，道路的边缘与粗细都与标签图较接近，在时，都有将背景类别识别为道路的情况，在时误分割率较小.实验结果表明，自适应全局通道注意力模块的有

33、效性，并且在4时性能最好，这与表 3 的结果一致.由 3 个数据集的实验结果可以看出，当设置s=4 时，AGCA 拥有最好的性能.此时 AGCA 可以帮助网络利用图像的全局信息指导局部信息，并且分析道路周边的像素类别以减少误分割率，提高分割准确率.s=43.3.2模块有效性分析以 ResNet50-C 加上ASPP 模块的网络作为基准网络进行模块有效性分析.在基准网络以后添加 AGCA 和解码器中的MFM 后，测试模块的有效性.设置 3 个消融实验来测试模块有效性.实验 1 在基准网络的基础上添加 AGCA.实验 2 在实验 1 的基础上添加 MFM，但只融合 Res-1 和 Res-4 的特

34、征图（浅层特征和深层特征）.实验 3 在实验 1 的基础上，将 4 个阶段的特征图全部进行融合，形成最终的全局指导多特征融合网络.实验中统一设置，如表 4 所示为基于 CITY-OSM 数据集对基准网络分别添加不同模块时的分割精度.可以看出，在添加 AGCA和 MFM 之后，网络的精度变高，道路提取效果变好.实验 1 中，相比于基准网络，道路的 IoU 提高了 0.86 个百分点，网络的 MIoU 提高了 1.95 个百分点，证明了 AGCA 的有效性，也证明该模块可以帮助网络识别与道路类间相似度高的其余类别，提高网络精度.实验 2 中，道路的 IoU 相较于实验 1 提高了 0.02 个百分

35、点，网络的 MIoU 提高了 0.29 个百分点，提升较少，但证明了深层特征与浅层特征融合可以提高网络精度，增加准确率.实验 3 中，道路的 IoU 相较于实验 1 提高了 0.52个百分点，网络的 MIoU 提高了 0.93 个百分点，证明了将 ResNet-50-C 的 4 个阶段进行特征融合的有效性，也证明了多特征融合模块的有效性.将 4 个阶段特征融合可以充分利用每个阶段中包含的位置信息和类别信息，减小误分割率，优化网络性能.实验背景道路(b)基准网络(d)s=2(c)s=1(e)s=3(f)s=4(g)s=5(h)真实数据(a)原图图 5 基于 DeepGlobe 数据集的超参数值可

36、视化结果对比Fig.5Comparisonofhyperparameter-valuevisualizationresultsbasedonDeepGlobedataset表 3 基于 CHN6-CUG 数据集的自适应全局通道注意力模块超参数取值对比Tab.3ComparisonofhyperparametervaluesforadaptiveglobechannelattentionmodulebasedonCHN6-CUGdataset%方法IoUMIoU背景道路基准网络97.1260.1378.63s=197.1660.2278.69s=297.2460.6278.93s=397.256

37、0.5278.86s=497.2961.9479.62s=597.1660.3778.77第4期宦海,等：基于遥感图像道路提取的全局指导多特征融合网络 J.浙江大学学报：工学版,2024,58(4):696707.701的可视化结果对比结果如图 7 所示.可以看出，随着模块的增加，道路的分割效果逐步变好，基准网络的误分割率很高，网络常将背景类别与建筑物类别识别为道路，使分割效果变差，在模块添加后误分割的情况明显改善，道路的完整度与粗细也与标签图更加接近.这与表 4 的数值结果一致.如表 5 所示为基于 DeepGlobe 数据集对基准网络分别添加不同模块时的分割精度.实验 1 中，在添加 AG

38、CA 后，相比于基准网络，道路的 IoU提高了 0.56 个百分点，网络的 MIoU 提高了0.30 个百分点，证明了 AGCA 的有效性.实验 2中，道路的 IoU 相较于实验 1 提高了 0.12 个百分点，网络的 MIoU 提高了 0.06 个百分点，证明了融合深层特征与浅层特征可以帮助网络提高精度.实验 3 中，道路的 IoU 相较于实验 1 提高了0.31 个百分点，网络的 MIoU 提高了 0.18 个百分点，此结果说明多特征融合可以充分利用特征图中的位置信息和类别信息，提升网络的分割性能.实验的可视化结果对比结果如图 8 所示，在添加AGCA 后，道路更加鲜明，

39、边缘更加清晰，道路误分割率降低；在添加 MFM 后，分割结果更接近标签图，误分割比重进一步减少，这与表 5 的数值结果一致.如表 6 所示为基于 CHN6-CUG 数据集对基准网络分别添加不同模块时的分割精度.实验 1 中，在添加 AGCA 后，相比于基准网络，道路的 IoU提升了 1.81 个百分点，网络的 MIoU 提高了 0.99个百分点，证明了此模块的有效性.实验 2 中，道路的 IoU 相较于实验 1 提高了 0.22 个百分点，网络的 MIoU 提高了 0.10 个百分点，证明了深层特征与浅层特征的有效性，也证明了 MFM 的有效背景道路(b)基准网络(d)s=2(c)s=1(e)

40、s=3(f)s=4(g)s=5(h)真实数据(a)原图图 6 基于 CHN6-CUG 数据集的超参数值可视化结果对比Fig.6Comparisonofhyperparameter-valuevisualizationresultsbasedonCHN6-CUGdataset表 4 基于 CITY-OSM 数据集的模块有效性分析Tab.4ModulevalidityanalysisbasedonCITY-OSMdataset%方法IoUMIoU背景建筑物道路基准网络83.4448.6176.3069.45+AGCA84.0353.0277.1671.40+AGCA+MFM(Res-1,Res-4

41、)84.1253.7677.1871.69+AGCA+MFM84.3154.9977.6872.33(a)原图(b)基准网络(c)添加 AGCA(d)添加 AGCA 和 MFM(e)真实数据建筑物道路背景图 7 基于 CITY-OSM 数据集的模块有效性分析可视化结果对比Fig.7ComparisonofvisualizationresultsformodulevalidityanalysisbasedonCITY-OSMdataset702浙江大学学报（工学版）第58卷性.实验 3 中，道路的 IoU 相比于实验 1 提高了1.27 个百分点，网络的 MIoU 相比于实验 1 提高了 0.6

42、7 个百分点，证明了融合 4 个阶段的特征可以帮助网络收集更丰富的位置信息与类别信息，提升分割的精确度.实验的可视化结果对比结果如图 9 所示.可以看出，基准网络的道路比标签图粗，误分割道路较高，在添加 AGCA 后，道路形状更接近标签图，道路边缘更清晰；在添加 MFM后，误分割情况更少，这与表 6 的数值结果一致.(a)原图(b)基准网络(c)添加 AGCA(d)添加 AGCA 和 MFM(e)真实数据背景道路图 8 基于 DeepGlobe 数据集模块的有效性分析可视化结果对比Fig.8Comparisonofvisualizationresultsformodulevalidityana

43、lysisbasedonDeepGlobedataset由以上 3 个数据集的实验结果可以看出，AGCA可以利用全局信息指导局部信息，减少误分割率；MFM 可以融合 4 个阶段的特征以利用特征图中的位置信息和类别信息提升网络的分割准确率.3.3.3网络对比与分析对比不同网络在道路提取中的性能，使用 DeepLabV323、APCNet24、CCNet25、DANet、EMANet26、DNLNet27、CRANet28、SANet29与所提网络进行对比.APCNet 融合多尺度、自适应和全局指导局部亲和力 3 个要素设计网络，道路分割性能较好；DANet 通过建模通道注意力和空间注意力来提取特

44、征；EMANet 设计期望最大化注意力机制（EMA），摒弃在全图上计算注意力图的流程，转而通过期望最大化（EM）算法迭代出一组紧凑的基，在这组基上运行注意力机制，大大降低了复杂度；DNLNet 设计解耦 non-local 模块，增加通道间的位置信息的交互，增加了道路分割的精确度和效率；CRANet 通过使用级联的残差注意力模块来提取遥感图像中边界细化的道路，该结构利用多尺度特征上的空间注意残块来捕获长距离关系，并引入通道注意里模块来优化多尺度特征融合，并且设计轻量级编码器-解码器网络，以自适表 5 基于 DeepGlobe 数据集的模块有效性分析Tab.5Modulevalidityanal

45、ysisbasedonDeepGlobedataset%方法IoUMIoU背景道路基准网络98.0662.2480.15+AGCA98.1062.8080.45+AGCA+MFM(Res-1,Res-4)98.1062.9280.51+AGCA+MFM98.1463.1180.63表 6 基于 CHN6-CUG 数据集的模块有效性分析Tab.6ModulevalidityanalysisbasedonCHN6-CUGdataset%方法IoUMIoU背景道路基准网络97.1260.1378.63+AGCA97.2961.9479.62+AGCA+MFM(Res-1,Res-4)97.2862.

46、1679.72+AGCA+MFM97.3763.2180.29(a)原图(b)基准网络(c)添加 AGCA(d)添加 AGCA 和 MFM(e)真实数据背景道路图 9 基于 CHN6-CUG 数据集模块的有效性分析可视化结果对比Fig.9ComparisonofvisualizationresultsformodulevalidityanalysisbasedonCHN6-CUGdataset第4期宦海,等：基于遥感图像道路提取的全局指导多特征融合网络 J.浙江大学学报：工学版,2024,58(4):696707.703应优化提取的道路边界.基于 CITY-OSM 数据集的网络分割性能对比结果

47、如表 7 所示.GGMNet 的道路 IoU=77.68%，MIoU=72.33%，优于其他的语义分割网络，与SANet 的分割效果接近.GGMNet 的另外 2 个类别的 IoU 也高于其他网络.GGMNet 的道路 IoU 比DNLNet 的高 0.56 个百分比，比 EMANet 高 0.65 个百分比，证明了网络在道路提取方面的有效性.实验结果表明，网络整体分割效果好，从图像中提取的信息丰富，可以更好地进行特征融合.实验的可视化对比结果如图 10 所示.可以看出，GGMNet的道路分割情况优于其他网络，比 SANet 的分割情况略好.在参与对比的网络中，GGMNet 的道路最为清晰，连

48、通状况最好，其余网络的误分割情况较为严重，将零散的背景类中颜色较深的阴影错误识别为道路，GGMNet 的误分割情况最少，分割结果最好，这与表 7 的数据结果一致.基于 DeepGlobe 数据集的网络分割性能对比结果如表 8 所示.可以看出，GGMNet 的 MIoU=80.63%，是最优结果，道路的 IoU=63.11%，也是最优结果；SANet 的道路 MIoU 次优，道路的 IoU 也为次优.这些结果证明了 GGMNet 的有效性，GGMNet在道路提取方面比其他网络精度更高，通过全局信息指导局部信息，并融合位置信息与类别信息使分割结果更准确.实验的可视化对比结果如图 11 所示.在标签

49、图中，方框区域没有道路，观察表 7 基于 CITY-OSM 数据集不同网络的分割性能对比Tab.7Segmentationperformancecomparisonofdifferentnet-worksbasedonCITY-OSMdataset%网络IoUMIoU背景建筑物道路DeepLabV383.4448.6176.3069.45APCNet83.7549.4276.7769.98CCNet83.3252.7676.5070.86DANet81.7647.6173.0467.47EMANet83.7653.3477.0371.38DNLNet83.9553.0077.1271.36CR

50、ANet83.2951.3576.8470.49SANet84.2654.7877.5572.20GGMNet84.3154.9977.6872.33(i)SANet(j)GGMNet(k)真实数据(a)原图(b)DeepLabV3(c)APCNet(d)EMANet(e)CCNet(f)DNLNet(h)DANet(g)CRANet建筑物道路背景图 10 不同网络基于 CITY-OSM 数据集的分割结果对比Fig.10SegmentationresultscomparisonofdifferentnetworksbasedonCITY-OSMdataset704浙江大学学报（工学版）第58卷

下载提示：咨信网仅提供存储空间/不修改/不编辑

【自信AI创作助手】【自信AI导航】
1、请仔细预览页面，基本判断完整性，对于直接下载带来的问题请及时与客服沟通；下载的文档，不会出现我们的网址水印。
2、该文档所得收入（下载+内容+预览）归上传者、原创作者；如果您是本文档原作者，请点此认领！既往收益都归您。

同意并开始全文预览

举报此文档有问题？有机会获“体验VIP”奖励！

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

10 金币 0人已下载

申诉本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请申请举报、认领或删除 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 基于遥感图像道路提取全局指导特征融合网络

咨信网温馨提示：
1、咨信平台为文档C2C交易模式，即用户上传的文档直接被用户下载，收益归上传人（含作者）所有；本站仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿，我们不确定上传用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的版权、权益或隐私，请联系我们，核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据，平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺，下载前须认真查看，确认无误后再购买，务必慎重购买；若有违法违纪将进行移交司法处理，若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传，付费前请自行鉴别，如您付费，意味着您已接受本站规则且自行承担风险，本站不进行额外附加服务，虚拟产品一经售出概不退款（未进行购买下载可退充值款），文档一经付费（服务费）、不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印，是因预览和防盗链等技术需要对页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有水印标识（原文档上传前个别存留的除外），下载后原文更清晰；试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓；PPT和DOC文档可被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；PDF文档不管是原文档转换或图片扫描而得，本站不作要求视为允许，下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用；网站提供的党政主题相关内容(国旗、国徽、党徽－－等)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
6、文档遇到问题，请及时私信或留言给本站上传会员【自信****多点】，需本站解决可联系【微信客服】、【 QQ客服】，若有其他问题请点击或扫码反馈【服务填表】；文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“【版权申诉】”（推荐），意见反馈和侵权处理邮箱：1219186828@qq.com；也可以拔打客服电话：4008-655-100；投诉/维权电话：4009-655-100。