耦合信息量和Logistic回归模型的滑坡易发性评价.docx
《耦合信息量和Logistic回归模型的滑坡易发性评价.docx》由会员分享,可在线阅读,更多相关《耦合信息量和Logistic回归模型的滑坡易发性评价.docx(20页珍藏版)》请在咨信网上搜索。
1、 耦合信息量和Logistic回归模型的滑坡易发性评价 李怡静 胡奇超 刘华赞 杜臻 陈佳武 黄锦昌 黄发明摘要:区域滑坡易发性预测能准确地反映出特定研究区内滑坡分布的空间概率特征。基于信息量和Logistic回归的耦合模型,对江西省崇义县滑坡易发性进行了预测,首先选取高程、坡度、坡体结构、平面曲率、剖面曲率、地形起伏度、距水系距离、岩性、归一化植被指数(NDVI)和归一化建筑指数(NDBI)等 10个影响因子;之后利用各因子的信息量值来构建Logistic回归模型;最后以信息量模型和Logistic回归模型作为对比模型来探讨3种模型各自的滑坡易发性评价结果。结果表明:耦合模型具有最好的预测性
2、能(AUC=80.4%),其余依次为Logistic回归模型(76.8%)和信息量模型(72.8%);各模型所预测的滑坡易发性分布规律具有一定的相似性,滑坡灾害多集中发生于海拔高程较低、接近水系、碳酸盐岩性地层构造、植被覆盖率低、建筑密集的区域。关 键 词:滑坡易发性预测; 影响因子; 信息量模型; Logistic回归模型; 信息量-Logistic回归耦合模型中图法分类号: O319.56文献标志码: ADOI:10.16232/ki.1001-4179.2021.06.0160 引 言滑坡是指斜坡岩土体沿着一定的软弱面或者软弱带发生剪切破坏产生滑移的一种灾害现象,常常给工农业生产以及人民
3、生命财产造成巨大损失1。在全球范围内,每年因滑坡及其次生灾害导致的人员伤亡数以万计2-4。根据自然资源部中国土地矿产海洋资源统计公报公布的数据,仅2017年国内就发生了地质灾害7 122起,造成327人死亡,25人失踪,173人受伤,直接经济损失达35.37亿元。此外,许多学者通过滑坡易发性预测来获取各地区潜在高危险区域来降低滑坡灾害损失,并在世界各地取得了良好的效果5。根据各个研究区内不同的环境状况,构建出与研究区相匹配的评价模型对滑坡易发性评价的准确性尤为重要。Huang等6根据评价原理将易发性预测模型分为概率模型7、启发式模型8、确定性模型9、数理统计10和机器学习模型11-13。其中,
4、数理统计模型利用统计方法来寻找各环境因子与滑坡发生之间的潜在联系,在易发性评价中有着广泛的应用14。在单一数理统计模型运用方面,许英姿等15采用信息量模型对滑坡易发性进行了评价,张向营等16也利用信息量模型对京张高铁的滑坡危险性进行了预测。此外,许冲等17-19也借助Logistic回归模型预测了降雨型滑坡易发性。虽然这两种模型的评价效果较理想,但仍具有单一模型评价的缺陷。对于信息量模型,其信息量值虽然能够反映出环境因子各子区间是否有利于滑坡发育,却并不能够表现出各影响因子对诱发滑坡的贡献权重。Logistic回归模型是基于自变量与因变量之间的多元统计分析,能够体现不同因子对滑坡影响程度的差异
5、,但却无法从空间角度表现各因子子区间与滑坡的相关性。综上所述,信息量模型与Logistic回归模型的互相结合,将弥补单一模型的局限性。因此,为了获取更理想的预测模型,本文以江西省崇义县滑坡为例,对信息量模型、Logistic回归模型以及信息量-Logistic回归耦合模型进行滑坡易发性对比研究,以期获得准确率更高的评估结果。1 研究方法通过信息量-Logistic回归耦合模型开展研究的主要步骤包括: 结合研究区滑坡发育特征及地质条件,选取合理的各环境因子; 基于滑坡编录信息及相关环境因子,提取各环境因子信息量值; 以信息量值为指标,构建逻辑回归模型; 易发性分布图的制作及模型精度评价。具体计算
6、流程如图1所示。1.1 信息量模型信息量模型在滑坡灾害预测领域应用较为广泛。在实际操作中,一般先计算出每个评价因子中各区间所对应的信息量值,再进行叠加得到多因子综合信息量值。其中,综合信息量值越大,表明滑坡灾害易发性程度越高20-24。信息量模型的计算过程如下:IAj-k=lnnj-k/sj-kn/sj=1,2,3,m;k=1,2,3,n(1)I=mj=1IAj-k=mj=1(IAj-1,IAj-2,IAj-3,IAj-n)(2)式中:nj-k和sj-k分别为第j个影响因子第k区间的滑坡面积和研究区面积;n和s分别为滑坡总面积和研究区总面积;IAj-k和I分别为单因子信息量值和综合信息量值。各
7、影响因子信息量值是有正负的,正值表示有利于滑坡灾害的发生;负值表示不利于滑坡灾害的发生。1.2 Logistic回归模型在已知的回归模型中,Logistic回归模型因其简单的形式以及优异的性能被广泛应用于滑坡的易发性评价。在本文研究当中,选取各评价因子的频率比值作为自变量,以滑坡发生与否作为分类因变量,利用构建好的模型对未知的滑坡栅格进行概率预测。该模型的计算过程如式(3)所示,对P作Logit函数转换,结果如式(4)所示:LogitP=a0+a1x1+a2x2+anxn (3)P=expa0+a1x1+a2x2+anxn1+expa0+a1x1+a2x2+anxn(4)式中:x1,x2,x3
8、,xn表示各環境因子;LogitP为滑坡灾害发生概率;a0为常数,表示在所有影响因子影响的前提下滑坡发生与不发生概率之比的对数值25;ai为逻辑回归系数。1.3 信息量-逻辑回归耦合模型在滑坡灾害分析中,信息量-Logistic回归耦合模型主要是利用已知的滑坡点和随机选取相同数量的非滑坡点来提取各因子子区间的信息量值,并以此建立逻辑回归方程。这样,不仅考虑了不同因子对滑坡发生的贡献权重,而且兼顾了各因子子区间致灾效应的大小。信息量-Logistic回归耦合模型的计算过程如下:LogitP=b0+b1(IA1-1,IA1-2,IA1-3,IA1-n)+bm(IAm-1,IAm-2,IAm-3,I
9、Am-n)=b0+b1(lnn1-1/s1-1n/s,lnn1-2/s1-2n/s,lnn1-n/s1-nn/s)+bm(lnnm-1/sm-1n/s,lnnm-2/sm-2n/s,lnnm-n/sm-nn/s)(5)式中:b1,b2,b3,bn为逻辑回归系数;IA1-1,IA1-2,IA1-3,IAm-n为影响因子集,也即各影响因子不同子区间的信息量值;lnn1-1/s1-1n/s,lnn1-2/s1-2n/s,lnnm-n/sm-nn/s是利用式(1)计算得到的不同影响因子各个子区间的信息量值。2 研究区概况崇义县位于江西省西南边陲,地处11355E11438E和2524N2555N之间,
10、面积约为2 206 km2,海拔140.02 061.3 m,境内地势高低起伏,山脉横纵交错。此外,全区以侵蚀构造中低山和侵蚀构造低山地形为主,少部分为岩溶和侵蚀堆积地形。全县雨量充沛,水资源极为丰富,主要水系有大江、小江及扬眉江等。因处于南岭东西向构造带与诸广山-万洋山南北向构造带复合部位,导致该地区局部滑坡灾害时有发生。崇义县地质灾害较为发育,类型较全,分布范围广,其主要地质灾害类型为滑坡和不稳定斜坡。通过研究区遥感影像解译及野外走访调查,总共编录了289处滑坡,其分布面积约为6.73 km2,滑坡平均面密度为0.31%,如图2所示。研究区滑坡发育表现为:人口居住密度较大的低山丘陵地区滑坡
11、灾害较为频繁,雨季和暴雨季往往呈现出集中暴发滑坡灾害的趋势。3 滑坡易发性评价因子体系的建立3.1 评价单元划分当前用于滑坡易发性评价的单元主要有:栅格、斜坡、子流域、均一条件及行政区划单元26。其中,栅格和斜坡单元应用得比较广泛。依据山脊山谷线等斜坡单元对真实地貌进行划分,虽然具有明确的地质特征意义,但是实际操作中十分依赖人工操作27。而栅格单元能够快速剖分并进行高效率的模型计算,被广泛应用于易发性的研究当中28。因此,本文选择栅格作为研究区评价单元,且栅格单元大小为30 m。3.2 数据来源本次研究采用的数据包括: 滑坡灾害点编录数据以及野外调查资料,用于获取滑坡分布图; 30 m分辨率的
12、数字高程模型,用于提取坡度、地形起伏度等地形因子信息; 1100 000比例尺的地质图,用于提取地层岩性信息; 崇义地区遥感影像,用于提取植被指数(NDVI)和建筑指数(NDBI)等。3.3 评价因子的选取及相关性分析在滑坡易发性的预测过程中,对于最适合的环境因子选取尚未达成统一意见,通常考虑地形地貌、水文环境、基础地质和植被覆盖等方面与滑坡关系密切的因子。本文通过分析崇义县滑坡灾害发育特征和常用的环境因子,选取高程、坡度、坡体结构、平面曲率、剖面曲率、地形起伏度、距水系距离、岩性、NDVI、NDBI等因子组成研究区滑坡易发性评价因子体系29。根据Jenks自然间断点法将各连续型因子分为6类,
13、各因子子类别频率比和信息量值如表1所列。利用ArcGIS 10.2软件得到各个评价因子的分级图如图3所示。3.3.1 地形地貌因子和水文环境因子各环境因子与滑坡之间的相关性主要利用各因子子类别相应的滑坡密度和信息量值来反映,如图4 所示。高程和坡度是影响滑坡的重要因素。由图4(a)和图4(b)可知,滑坡主要发生在高程140353 m和坡度8.0319.96的区域,其滑坡分布密度分别为0.59%和0.57%。坡体结构的类型也能影响滑坡的发育,主要分为凹形坡、凸形坡、直线形坡和复合形坡,且在复合型和凸型坡中有利于滑坡的出现,如图4(c)所示。平面曲率和剖面曲率反映了地形对地表水流的敛散性和加速作用
14、,当平面曲率在-0.300.19、剖面曲率在-0.270.79區间时,滑坡有较大概率发生,如图4(d)(e)所示。而地形起伏度作为一个地区重要的地形属性,其对研究区内滑坡灾害的发生也有着重要的影响,当地形起伏度在070之间时,有利于滑坡的发生,如图4(f)所示。水系指流域内所有河流、湖泊等各种水体组成的水网系统,是诱发滑坡或在滑坡出现之后加剧灾害的重要因素30-31。研究区主要的水系包括大江、小江及扬眉江等河流。本文通过ArcGIS软件对DEM数据经过填洼、流向流量提取、栅格河网矢量化处理,得到水系矢量河网,再进行多环缓冲区分析得到距水系距离分布图,如图4(g)所示。当距水系距离在500 m以
15、内时,信息量大于0,表明距离水系越近的区域越容易发生滑坡灾害。3.3.2 基础地质和地表覆被因子岩性是滑坡发生的重要内部因素,如图4(h)所示。变质岩岩类、碎屑岩岩类、碳酸盐岩岩类构造较为软弱,其对应的信息量均大于0,有利于滑坡发生。NDVI和NDBI是用来表征地表植被覆盖程度以及地表建筑化程度的相对大小,如图4(i)(j)所示;当NDVI小于0.345和NDBI大于0.483时,该区域有利于滑坡的发育;而当NDBI小于0.29时,则不利于滑坡的发生。4 滑坡易发性评价4.1 信息量模型与逻辑回归模型本次研究利用研究区内7 618个已知滑坡栅格和7 618个非滑坡栅格所提取的各因子子区间信息量
16、值,并结合式(2)来获取研究区滑坡易发性。另外,通过Jenks自然间断点法将崇义县滑坡易发性划分为5个等级:极低易发区、低易发区、中易发区、高易发区、极高易发区,最终得到滑坡易发性分级图,如图5(a)所示。再利用研究区内7 618个滑坡栅格和随机选取的7 618个非滑坡栅格作为Logistic回归模型的数据集。以高程、坡度等10个因子不同子区间的频率比值作为自变量,以滑坡发生与否(标记为1和0) 作为因变量。随后利用统计软件SPSS 24.0进行二元Logistic回归分析,得到各个影响因子的Logistic回归系数值。由表 2可知,各因子显著性检验统计量Sig均小于所设的显著性水平0.05,
17、说明Logistic回归模型具有统计意义。Logistic回归拟合方程如式(6)所示,从方程中可以看出:高程、距水系距离、岩性、NDVI、NDBI等因子对滑坡的发生起主要控制作用。利用ArcGIS10.2获取的研究区滑坡易发性分级图,如图5(b)所示。LogitP=-3.856+0.594高程+0.352坡度+0.391坡体结构+0.382平面曲率+0.406剖面曲率-0.295地形起伏度+0.531距水系距离+0.426岩性+0.544NDVI+0.611NDBI(6)4.2 信息量-Logistic回归耦合模型本文将各因子子区间的信息量值和滑坡发生与否(记为1和0)作为逻辑回归模型的输入数
18、据来构建信息量-Logistic回归耦合模型。耦合模型下各个影响因子的Logistic回归系数值如表3所列。结果显示各因子Sig均小于所设的显著性水平0.05,说明耦合模型具有统计意义。上述耦合模型的回归拟合方程如下式(7)所示,从方程中可以看出,高程、距水系距离、NDVI、NDBI等因子对滑坡的发育起主要控制作用。此外,耦合模型的滑坡易发性分级图,如图5(c)所示。将该分级图与历史滑坡灾害点图层进行对比分析,发现耦合模型得出的评估结果与实际情况具有很高的吻合度。LogitP=-0.014+0.635高程+0.098坡度+0.304坡体结构+0.345平面曲率+0.289剖面曲率+0.002地
19、形起伏度+0.530距水系距离+0.323岩性+0.557NDVI+0.728NDBI(7)4.3 模型精度评估及易发性结果分析本文采用预测率曲线法对信息量模型、Logistic回归模型和信息量-Logistic回归耦合模型得出的滑坡易发性进行精度评估。预测率曲线能够表示实测数据与拟合数据之间的关系,预测率曲线下的面积AUC越大,说明拟合数据和实测数据越接近,模型的成功率也就越高。从图5(d)中可以看出:耦合模型的成功率(80.4%) 较信息量模型(72.8%)和Logistic回归模型(76.8%)的成功率更高,说明耦合模型具有更好的预测性能。由上述3种模型得到的易发性分级图可知,其滑坡易发
20、性分布规律具有一定相似性。本文通过将滑坡易发性分布图和滑坡灾害点分布图进行叠加分析,结果如下。(1) 从统计结果表 4可以看出,耦合模型较信息量模型和Logistic回归模型有40.93%的滑坡灾害点落在极高易发区(信息量模型为30.67%,Logistic回归模型为19.54%),其面积占全县总面积11.56%;有33.84%的滑坡灾害点落在高易发区(信息量模型为34.94%,Logistic回归模型为31.47%),其面积占全县总面积22.74%。(2) 极高易发区和高易发区集中于海拔高程较低、接近水系、碳酸盐岩性地层构造、植被覆盖率低、建筑密集的区域。其中水通过对斜坡进行冲刷、软化以及水
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 耦合 信息量 Logistic 回归 模型 滑坡 易发性 评价
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【人****来】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【人****来】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。