系统聚类分析.pptx
《系统聚类分析.pptx》由会员分享,可在线阅读,更多相关《系统聚类分析.pptx(43页珍藏版)》请在咨信网上搜索。
1、地理系统分析的意义和作用地理系统分析的意义和作用地理系统是一种多要素、多类型、多种区域组合地理系统是一种多要素、多类型、多种区域组合在一起的、具有特殊结构与功能的综合体。因此在一起的、具有特殊结构与功能的综合体。因此对地理系统的研究很重要的一个问题就是要进行对地理系统的研究很重要的一个问题就是要进行地理分区与分类。由于地理系统的复杂性,使地地理分区与分类。由于地理系统的复杂性,使地理学长期不能定量的、客观的、科学的分类。随理学长期不能定量的、客观的、科学的分类。随着生产技术、数学、电子计算机和相邻科学定量着生产技术、数学、电子计算机和相邻科学定量分类法的发展,地理学的分类已从传统的、主要分类法
2、的发展,地理学的分类已从传统的、主要靠经验和定性的知识进行分类向应用数学的方法靠经验和定性的知识进行分类向应用数学的方法和电子计算机进行定量分类。有人称这种分类法和电子计算机进行定量分类。有人称这种分类法为聚类分析。聚类分析法是最新近发展起来的一为聚类分析。聚类分析法是最新近发展起来的一门多元统计方法,它可以避免传统分类法的主观门多元统计方法,它可以避免传统分类法的主观性和任意性的确定。性和任意性的确定。聚类分析聚类分析:根据地理变量(或指标或样品)的属性或根据地理变量(或指标或样品)的属性或特征的相似性、亲疏程度,用数学的方法把它们逐特征的相似性、亲疏程度,用数学的方法把它们逐步地分型划类,
3、最后得到一个能反映个体或站点之步地分型划类,最后得到一个能反映个体或站点之间、群体之间亲疏关系的分析系统。间、群体之间亲疏关系的分析系统。聚类分析法的特点:聚类分析法的特点:1 1、事先无需知道分类对象的分类结构,而只需要一、事先无需知道分类对象的分类结构,而只需要一批地理数据。批地理数据。2 2、选好分类统计量,并按一定的方法步骤进行计算、选好分类统计量,并按一定的方法步骤进行计算3 3、最后自然的、客观的得出一张完整的分类系统图、最后自然的、客观的得出一张完整的分类系统图聚类分析是根据各变量的观测值予以分类的,它聚类分析是根据各变量的观测值予以分类的,它涉及到通过各种途径和手段所得到的有意
4、义的地涉及到通过各种途径和手段所得到的有意义的地理数据。由于要素的量纲、数量级和数量变化幅理数据。由于要素的量纲、数量级和数量变化幅度的差异,如用原始数据进行聚类分析,就是将度的差异,如用原始数据进行聚类分析,就是将不同性质、不同量纲、不同数量变化幅度的数值不同性质、不同量纲、不同数量变化幅度的数值都统计在一起,这样就可能突出某些数量级特别都统计在一起,这样就可能突出某些数量级特别大的变量对分类的作用,而压低甚至排除了某些大的变量对分类的作用,而压低甚至排除了某些数量级很小的变量对分类的作用。为了有利于分数量级很小的变量对分类的作用。为了有利于分析、对比和使分类清晰,常对原始地理数据进行析、对
5、比和使分类清晰,常对原始地理数据进行适当和必要的处理和变换,使其在某种共同的、适当和必要的处理和变换,使其在某种共同的、相对均匀化的数值范围内。相对均匀化的数值范围内。一、聚类要素的数据处理一、聚类要素的数据处理 当分类要素的对象确定之后,在进行聚类分析之前,首先要对聚类要素进行数据处理。假设有m 个聚类的对象,每一个聚类对象都有n个要素构成。聚 类 对 象 要 素 在聚类分析中,常用的聚类要素的数据标准化处在聚类分析中,常用的聚类要素的数据标准化处理方法如下:理方法如下:地理数据的对数变换地理数据的对数变换在对地理数据进行标准化之前,应先对数据进行对数变换。设有n个地点、地区,每个地点又有m
6、个指标,用Xij表示第i个地点或地区的第j个指标值。P131地点原始数据自然对数变换海拔高度年平均降水量最大冻土深8级大风日数海拔高度年平均降水量最大冻土深8级大风日数(1)(2)(3)(4)(1)(2)(3)(4)哈巴河532.6173.8150.061.86.278 5.1585.0114.124阿勒泰735.1191.5146.037.76.600 5.2554.9843.630克拉玛依427.0114.4197.075.46.057 4.7405.2834.323巴楚1116.541.661.07.67.018 3.7284.1112.028莎车1231.242.593.011.07.
7、116 3.7504.5332.398于田1427.046.481.01.47.263 3.8374.3940.336数据变换表数据变换表 地理数据的标准化:标准差标准化、极差标准化地理数据的标准化:标准差标准化、极差标准化标准差标准化,即把变换后的数据变换后的数据 减去其均值,再除以其标准差Sj (3.4.2)地点自然对数变换标准差标准化数据海拔高度年平均降水量最大冻土深8级大风日数海拔高度年平均降水量最大冻土深8级大风日数(1)(2)(3)(4)(1)(2)(3)(4)哈巴河6.2785.1585.0114.124-0.9101.0330.6580.865阿勒泰6.6005.2554.98
8、43.630-0.2501.1670.5970.541克拉玛依6.0574.7405.2834.323-1.3630.4551.2710.996巴楚7.0183.7284.1112.0280.607-0.946-1.372-0.511莎车7.1163.7504.5332.3980.808-0.915-0.420-0.268于田7.2633.8374.3940.3361.109-0.795-0.734-1.623地点自然对数变换海拔高度哈巴河6.2780.4440.197136阿勒泰6.6000.1220.014884克拉玛依6.0570.6650.442225巴楚7.0180.2960.087
9、616莎车7.1160.3940.155236于田7.2630.5410.292681合计40.3321.189778平均数6.722 极差的标准化,即 经过这种标准化所得的新数据,各要素的极大值为1,极小值为0,其余的数值均在0与1之间。例题:表3.4.2给出了某地区九个农业区的七项指标,对它进行极差标准化处理 表表3.4.2 某地区九个农业区的七项经济指标数据某地区九个农业区的七项经济指标数据 区代号人均耕地x1(hm2/人)劳均耕地x2(hm2/个)水田比重x3(%)复种指数x4(%)粮食亩产x5(kg/hm2)人均粮食x6(kg/人)稻谷占粮食比重x7(%)G10.2941.0935.
10、63113.64510.51036.412.2G20.3150.9710.3995.12773.5683.70.85G30.1230.3165.28148.56934.5611.16.49G40.1790.5270.391114458632.60.92G50.0810.21272.04217.812249791.180.38G60.0820.21143.78179.68973636.548.17G70.0750.18165.15194.710689634.380.17G80.2930.6665.3594.93679.5771.77.8G90.1670.4142.994.84231.5574.6
11、1.17 表表3.4.3 极差标准化处理后的数据极差标准化处理后的数据x1x2x3x4X5X6X7G10.911.000.070.150.181.000.14G21.000.870.000.000.000.240.00G30.200.150.070.440.440.080.07G40.440.380.000.130.180.130.00G50.030.031.001.001.000.451.00G60.030.030.610.690.650.130.59G70.000.000.900.810.840.131.00G80.910.530.070.000.100.430.09G90.380.260
12、.040.000.150.000.00二、距离的计算 假设我们把研究的对象(地点)视为假设我们把研究的对象(地点)视为m m维空间的点,所谓距离就是用各维空间的点,所谓距离就是用各种方法计算出各点间的相互距离(种方法计算出各点间的相互距离(d dijij),并用它来刻化各点间的相似并用它来刻化各点间的相似性或亲疏程度。常见的距离有绝对值距离、欧式距离。性或亲疏程度。常见的距离有绝对值距离、欧式距离。绝对值距离绝对值距离 (3.4.5)式中,式中,X Xikik代表第代表第i i个地点的第个地点的第k k个指标的值,个指标的值,X Xjkjk代代表第表第j j个地点的第个地点的第k k个指标的值
13、,个指标的值,k=1k=1,2 2,3 3.,m.,m个指标数的距离系数个指标数的距离系数欧式距离式中,式中,Xik代表第代表第i个地点的第个地点的第k个指标的值,个指标的值,Xjk代表第代表第j个地点的第个地点的第k个指标的值,个指标的值,k=1,2,3.,m个指标数的距离系数个指标数的距离系数(3.4.9)三、直接聚类法 原理:原理:先把各个分类对象单独视为一类,然后根据距离最小的原则,依次选出一对分类对象,并成新类。如果其中一个分类对象已归于一类,则把另一个也归入该类;如果一对分类对象正好属于已归的两类,则把这两类并为一类。每一次归并,都划去该对象所在的列与列序相同的行。经过m-1次就可
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 系统 聚类分析
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【精****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【精****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。