基于空间特征的机器学习模型浅海水深反演.pdf
《基于空间特征的机器学习模型浅海水深反演.pdf》由会员分享,可在线阅读,更多相关《基于空间特征的机器学习模型浅海水深反演.pdf(12页珍藏版)》请在咨信网上搜索。
1、基于空间特征的机器学习模型浅海水深反演孟鑫垚1,2,刘焱雄2*,陈义兰2,王燕红2,陆应诚1(1.南京大学地理与海洋科学学院,江苏南京210023;2.自然资源部第一海洋研究所,山东青岛266061)摘要:针对遥感水深反演在复杂海洋环境区域光谱特征信息量不足的问题,综合考虑多光谱数据与其空间特征,利用多层感知机(Multi-LayerPerception,MLP)、随机森林(RandomForest,RF)和支持向量机(SupportVectorMachine,SVM)三种机器学习算法构建了基于多光谱数据及其空间特征的水深反演模型。以蜈支洲岛为例,选取空间位置和坡度作为空间特征,结合 Worl
2、dView-2 影像光谱特征和实测水深数据,反演浅海水深。结果表明,在相同的条件下,3 种机器学习算法都得到了较好的反演结果,其中多层感知机模型反演精度最高。引入空间特征的模型真实地反映了研究区域海底地形的起伏特征,精度明显优于仅基于光谱的模型,且其平均绝对误差控制在 2m 以内。模型在 20m 以浅区域精度低于 20m 以深区域。空间特征能够有效地减弱复杂海洋环境对遥感测深模型的影响,且空间位置信息对模型精度提升更为明显。关键词:遥感反演;浅海水深;空间特征;多光谱影像;机器学习中图分类号:P237;P229文献标志码:A文章编号:1671-6647(2023)03-0498-12doi:1
3、0.12362/j.issn.1671-6647.20220813001引用格式:孟鑫垚,刘焱雄,陈义兰,等.基于空间特征的机器学习模型浅海水深反演J.海洋科学进展,2023,41(3):498-509.MENGXY,LIUYX,CHENYL,etal.Spatialfeature-basedmachinelearningmodelforshallowwaterdepthretrievalJ.AdvancesinMarineScience,2023,41(3):498-509.水深信息是海洋环境的重要参数之一,在海上运输、海岸带管理、珊瑚礁生态系统保护和浅海资源开发方面具有重要意义。船载声呐测
4、深系统和机载激光测深系统1作为传统水深测量方式,可以获取高质量、高精度的水深数据,但是耗时长、成本高、覆盖范围有限。自 20 世纪 60 年代以来,随着卫星遥感的不断发展,遥感测深一直受到广泛关注2。遥感测深不受天气和时间的约束,能够实现全天候不间断检测,具有适用范围广、覆盖面积大、费用低、效率高且获取方便等特点。目前,利用多光谱遥感数据反演水深的模型主要包括理论解析模型3、统计模型4和半理论半经验模型5-6。其中,理论解析模型根据辐射传输方程原理和水体光谱特征构建,模型参数复杂且难以进行推广;统计相关模型根据实测水深资料和遥感影像的灰度值进行统计分析,缺乏相应的物理意义;半理论半经验模型应用
5、最为广泛,其利用理论模型的简化模式,结合统计数据拟合经验参数,提高了反演精度且可移植性强。现有模型在浅海水深的光学反演方面取得了较好的效果7。计算机领域技术的发展为研究水深反演方法提供了机遇和条件,如机器学习算法在解决多变量、非线收稿日期:2022-08-13资助项目:自然资源部海洋测绘重点实验室开放研究基金项目(2021B01)作者简介:孟鑫垚(1998),男,硕士研究生,主要从事遥感水深反演方面研究.E-mail:*通信作者:刘焱雄(1968),男,研究员,博士,博士生导师,主要从事海洋测绘方面研究.E-mail:(王燕编辑)第41卷第3期海洋科学进展Vol.41No.32023年7月AD
6、VANCESINMARINESCIENCEJuly,2023性复杂问题等方面具有出色的模拟能力,能够克服人为因素的局限性,近年来被广泛应用于多光谱水深反演。Ai 等8根据像素之间的空间自相关性采用卷积神经网络构建模型,并对北岛水深分布情况进行了反演。Sagawa 等9采用随机森林算法和多时相卫星图像创建深度反演模型,结果表明模型适用于水质清澈条件下的各种浅水区域。Misra 等10使用支持向量机(SupportVectorMachine,SVM)模型对荷兰圣马丁岛水深进行反演,验证了支持向量机在浅海水深反演中的性能。Wang 等11采用空间位置和光谱信息作为多层感知机的输入,构建的深度估计模型
7、很好地解决了由海底不均匀底质带来的不确定性。Lai 等12提出了一种采用多层感知机直接从大气顶部(TopoftheAtmosphere,TOA)数据中检索水深的方法,结果表明该方法可以绕过校正气溶胶影响的要求,并具备可移植性。众多研究表明,机器学习模型具有简单、高效和可扩展性强等优点,在浅海水深反演方面应用广泛。现有遥感水深反演模型多以光谱值及其变化参数作为主要参数。受海洋水体环境和底质的影响13-14,相同的波段光谱值对应着不同的水深值,仅依赖光谱特征不足以精确反演水深。理想条件下,在反演模型中加入叶绿素浓度、悬浮物浓度等海洋环境参数,可以获取高精度的反演水深。然而,海洋环境参数复杂且难以获
8、取,直接加入反演模型会导致模型过于复杂,不具备可移植性。空间特征对于遥感影像也是一个有效的特征,以往的研究鲜有考虑把影像的空间特征作为参数用于水深反演,也尚未分析空间特征对反演的影响。空间相邻点通常具有相似的水深、底部类型和水质,它们具有很强的空间聚集性。同时海洋环境和海洋空间特征相关,反映到光谱上表现为相同的波段光谱值在不同的空间特征对应着不同的水深值,因此,可以在遥感水深反演模型中加入空间特征以弥补光谱特征的不足。为此,本文开展了基于空间特征的机器学习模型浅海水深反演研究。本文以海南省三亚市蜈支洲岛附近浅海水域作为研究区域,结合光谱特征与其空间特征,选择多层感知机(Multi-LayerP
9、erception,MLP)、随机森林(RandomForest,RF)和 SVM 三种模型构建水深反演模型,采用少量的实测点获取高分辨率水深模型,并利用实测水深数据对反演结果进行精度评价,探究空间特征和光谱特征对水深反演的影响。1研究区数据及反演方法本文提出的基于多光谱数据及其空间特征的水深反演模型主要包括数据预处理和模型构建两个主要步骤,整体流程如图 1 所示。在数据预处理阶段,对 WorldView-2 影像数据进行辐射定标、大气校正和水陆分离,对实测水深数据进行潮汐改正。在模型构建阶段,提取特征并构建水深反演模型对特征集进行训练和反演,得到最终的水深反演值。1.1研究区及研究区数据蜈支
10、洲岛(10945161094610E,181821181858N)位于海南省三亚市北部,其形状呈不规则的蝴蝶状,东西长 1400m,南北长 1100m,占地面积约 1.48km2。岛东南侧近岸海域为活珊瑚礁-岩礁底质复合区,海底地形陡峭,东南侧区域 10m 以浅水域狭窄;岛西南侧以沙底质为主,珊瑚覆盖度较低;岛北侧近岸海域为活珊瑚礁块-沙质底质复合分布区,海底平缓15。岛周围水质清澈,水体透明度高,适用于遥感水深反演研究。研究区位置如图 2 所示。采用WorldView-2 卫星数据作为研究区影像数据,影像获取于2012 年9 月28 日3 时31 分,分辨率为影像数据实测数据水深反演值水深反
11、演模型数据预处理特征提取特征集训练集验证集图 1 反演方法流程Fig.1 Flow diagram of proposed method3期孟鑫垚,等:基于空间特征的机器学习模型浅海水深反演4992m,影像包含 8 个多光谱波段,分别为蓝波段(450510nm)、绿波段(510580nm)、红波段(630690nm)、近红外波段(770895nm)、海岸波段(400450nm)、黄色波段(585625nm),以及红色边缘波段(705745nm)和近红外 2 波段(8601040nm)。模型训练和验证水深数据采用船载测深仪实测数据,获取时间为 2016 年,深度基准为理论深度基准面,水深分辨率约
12、为 6m,水深范围为 033.8m,平均水深为 20.6m。研究区地形稳定,水深随时间变化不大。根据实测水深数据提取研究区域坡度数据。研究区影像数据及部分实测点如图 3 所示。1.2数据预处理1.2.1辐射定标辐射定标原始影像上的灰度值(DigitalNumber,DN 值)为无量纲的数字表达形式,需要将其转换为有意义的辐亮度。对 WorldView-2 影像而言,转换公式如下:L(i)=absCalFactoriDNii,(1)i=1,2,NNL(i)iabsCalFactoriiDNiiii式中:,为光谱波段数;为第 波段的辐亮度值,单位为 W/(m2srm);为第 波段的绝对定标系数;为
13、第 波段的像元灰度值;为第 波段的等效波段宽度。本文采用 ENVI(TheEnvironmentforVisualizingImages)中的 WorldViewRadiance 模块对影像进行辐射定标。1.2.2大气校正及水陆分离大气校正及水陆分离大气对不同波长的光具有选择性衰减作用,因而大气对不同波段影像的影响程度不同,需要通过大气校正去除大气散射及气溶胶的影响,获取地物的真实反射率。本文采用 ENVI 中的 FLAASH模块对影像进行大气校正,然后根据归一化水体指数(NormalizedDifferenceWaterIndex,NDWI)对图像进行阈值分割,划分出研究区水域。其计算公式如
14、下:NDWI=RGreenRNIR2RGreen+RNIR2,(2)RGreenRNIR2式中:为 WorldView-2 影像中绿波段的反射率;为 WorldView-2 影像中近红外 2 波段的反射率。22N2018110112E海南岛蜈支洲岛南海图 2 研究区位置Fig.2 Location of study area181930N18180010945001094630E实测水深点00.751.50 nmile图 3 研究区的 WorldView-2 影像及部分实测水深点位置Fig.3 WorldView-2 image of the study area anda few in-si
15、tu water depth points500海洋科学进展41卷1.2.3潮汐改正潮汐改正Z实测水深数据是以理论深度基准面为基准的稳态水深,而水深反演模型获取的水深为影像过境时间对应的瞬时水深,二者存在差异,需要对实测水深进行潮汐改正。假设海域稳态水深为 H,影像过境瞬时水深为,则其转换关系为:Z=H+TL,(3)TL式中,(TidalLevel)指影像过境时距离深度基准的瞬时潮位。根据影像过境时间的潮汐表16,可以得到影像获取时的瞬时潮高为 0.92m。通过式(3)可以计算出影像过境时刻的瞬时水深。1.3模型构建1.3.1特征参数选取特征参数选取WorldView-2 影像包含 8 个多光
16、谱波段,因此需要选择最优的波段组合作为模型的光谱参数。Kerr17揭示了线性比值模型的最佳 WorldView-2 频带比。Wang 等11采用蓝波段、绿波段、红波段和近红外波段四个 WorldView-2 影像常用波段作为多层感知机模型的输入参数反演浅海水深。然而,这些研究仅采用了 WorldView-2 影像的部分波段,并未充分利用 WorldView-2 影像的光谱信息。考虑到某些波段比其他波段包含更多的底部反射率信息或更少的噪声,例如海岸波段,其对水深变化敏感,且能渗透到更深的水中,故本文采用 WorldView-2 影像的蓝波段、绿波段、红波段、近红外波段、海岸波段、黄波段、红色边缘
17、波段和近红外 2 波段作为模型光谱参数。选择空间位置信息和坡度信息作为空间特征:空间位置作为最简单的空间特征,描述水平方向上的空间关系;坡度刻画地物的高程变化,描述垂直方向上的空间关系;二者均能直接有效地表示地物点的空间分布。对研究区实测水深数据和研究区影像数据进行有效性检验和归一化处理后提取相应特征。最终模型输入参数为 8 个光谱特征和 3 个空间特征(表示为空间位置 X、Y,坡度 slope)。1.3.2模型构建方法模型构建方法1.3.2.1MLPMLP 又称深度神经网络,一般包含输入层、隐藏层和输出层三层结构,属于前向结构化的人工神经网络,能够处理非线性可分离问题,且模型易于实现、可扩展
18、性强、拟合速度快、稳定性高、学习过程高效18。其理论模型如下:H=(Xwh+bh),(4)O=Hwo+bo,(5)HXwhbhO式中:为隐藏层输出;为激活函数;为输入参数;和分别为隐藏层的权重和偏差参数;为wobo模型输出;和 分别为输出层的权重和偏差参数。经过调试,构建了包含 1 个输入层、3 个隐藏层和 1 个输出层的模型。其中输入层的节点包含 8 个光谱特征和 3 个空间特征。每个隐藏层包含的节点数目分别为 8、16 和 16,层与层之间的激活函数选择为 tanh,优化器选择为 Adadetla。由于本文构建模型为预测模型,最后一层和输出层之间不添加激活函数,且输出层只有 1 个节点,输
19、出参数为预测水深。多层感知机(MLP)网络结构如图 4 所示。隐藏层激活函数:tanh输入层输出层图 4 MLP 网络结构Fig.4 MLP network structure3期孟鑫垚,等:基于空间特征的机器学习模型浅海水深反演5011.3.2.2RF随机森林是决策树的集成算法。非线性回归的随机森林是根据随机向量生长树木形成的,使得树木预测器采用数值而不是类标签。这种非线性回归属于决策树学习家族的机器学习方法19。随机森林包含多个决策树以降低过拟合的风险,具有易解释性、可处理类别特征、易扩展到多分类问题、不需特征缩放等性质。经过调试,构建了 1 个包含 20 个决策树的随机森林模型,其中模型
20、的输入参数为 8 个光谱特征和 3 个空间特征,输出参数为预测水深。1.3.2.3SVM支持向量回归(SupportVectorRegression,SVR)是在 SVM 基础上发展的一种回归算法,是一种小样本学习方法,具有良好的非线性处理能力,能够有效避免迭代过程陷入局部最小值。该方法通过和函数进行特征升维,在高维空间构造决策函数实现线性回归20。从几何角度分析,SVR 算法就是在 n 维空间找到 1 个回归参考平面,使各点到超平面的距离最小。其回归方程为:f(xn)=T(xn)+bmin12|2+Cni=1,j=1(i+j),(6)xnbij,C|式中:为样本输入;、为参数;T 为转置;、
21、为松弛变量;i=1,2,n;j=1,2,n;n 为样本数量;为误差惩罚参数。最终问题为求最小的。rbfC经过调试,构建了 1 个卷积核为、误差惩罚参数 为 5.0 的模型。其中模型的输入参数为 8个光谱特征和 3 个空间特征,输出参数为预测水深。2实验设计与结果分析2.1实验设计与结果本文随机从实测点中选取训练点和验证点,保证测深点随机且均匀分布于实验区域。设置不同水深训练点数量实验组,探究训练点数量对模型训练的影响。同时采用多层感知机(MLP)、随机森林(RF)和支持向量回归(SVR)三种模型作为实验模型。选择影像光谱特征作为模型固定输入参数,分别结合不同的研究区域空间特征,分析研究区域空间
22、特征对遥感反演水深的影响。设置了 4 组对照实验,分别为以光谱特征作为输入的模型(简称光谱模型)、以光谱特征和坡度特征作为输入的模型(简称坡度模型)、以光谱特征和空间位置特征作为输入的模型(简称位置模型),以及以光谱特征、空间位置特征与坡度特征作为输入的模型(简称空间模型)。输入参数如表 1 所示。2.2评价指标选取R2RMSE统计学指标通过数据的变化来表征模型拟合的好坏。为了评价不同模型的精度,本文选取相关系数(correlationcoefficient,R2)、均方根误差(RootMeanSquareError,RMSE),平均相对误差(MeanRelativeError,MRE)、平均
23、绝对误差(MeanAbsoluteError,MAE)、平均误差(MeanError,ME)五种指标作为评估参数。其中,表示确定系数,用于衡量模型的拟合效果;衡量观测值与真实值之间的偏差,常用来作为机器学习模型预测结果衡量的标准;MRE 是相对误差的平均值,可以表 1 模型输入参数Table 1 Input parameters for the model光谱模型坡度模型位置模型空间模型光谱波段光谱波段光谱波段光谱波段slopeXXYYslope502海洋科学进展41卷反映预测值误差的相对分布;MAE 是绝对误差的平均值,可以反映预测值误差的实际情况;ME 是误差的平均值,可以反映预测值误差的
24、分布情况。5 种指标的计算方法为:R2=1Ni=1(yib yi)2Ni=1(yi yi)2,(7)RMSE=1NNi=1(yib yi)2,(8)MRE=1NNi=1?yib yiyi?100%,(9)MAE=1NNi=1?yib yi?,(10)ME=1NNi=1(yib yi),(11)i=1,2,NNyib yiyi式中:,为水深点数量;为实测水深;为模型预测水深;为实测水深的平均值。2.3模型精度评定2.3.1不同数量训练点模型精度评定不同数量训练点模型精度评定由不同数量训练点模型的精度评价结果(表 2)可知,随着训练点数量的增加,模型精度呈现先上升、然后趋于稳定、最后下降的趋势。模
25、型精度在训练点数量为 2000 时达到最优。随着训练点数量的进一步增加,模型精度不再提升。当训练点数量为 3000 时,模型出现过拟合现象,精度呈现较大幅度的降低。结果表明,训练点数量的不断增加并不能使得训练模型精度不断增加,使用少量的训练样本对水深反演更有意义。3 种模型在训练过程中均出现上述趋势,故本文后续实验从实测水深点中随机选取 2000 个水深点作为训练数据集用于训练构建的模型,另外在剩余水深点中随机选择 400 个点作为验证数据集来验证和评估模型性能。表 2 不同数量训练点模型的精度评价Table 2 Model accuracy evaluation of different n
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 空间 特征 机器 学习 模型 浅海 水深 反演
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。