SPSS聚类分析具体操作步骤.ppt
《SPSS聚类分析具体操作步骤.ppt》由会员分享,可在线阅读,更多相关《SPSS聚类分析具体操作步骤.ppt(20页珍藏版)》请在咨信网上搜索。
SPSS的聚类分析l俗语说,物以类聚、人以群分。l但什么是分类的根据呢?l举例:要想把中国的县分成若干类,就有很多种分类法;l可以按照自然条件来分,l比如考虑降水、土地、日照、湿度等各方面;l也可以考虑收入、教育水准、医疗条件、基础设施等指标;l既可以用某一项来分类,也可以同时考虑多项指标来分类。聚类分析概述(一一)概念概念l(1)(1)聚类分析是统计学中研究聚类分析是统计学中研究“物以类聚物以类聚”的一种方法的一种方法,属多元统计分析方法属多元统计分析方法.例如:细分市场、消费行为划分l聚类分析是建立一种分类,是将一批样聚类分析是建立一种分类,是将一批样本本(或变量或变量)按照在性质上的按照在性质上的“亲疏亲疏”程程度度,在在没有先验知识没有先验知识的情况下自动进行分的情况下自动进行分类的方法类的方法.其中其中:类内个体具有较高的相类内个体具有较高的相似性似性,类间的差异性较大类间的差异性较大.(二二)“亲疏亲疏”程度的衡量程度的衡量(1)(1)衡量指标衡量指标相似性相似性:数据间相似程度的度量数据间相似程度的度量距离距离:数据间差异程度的度量数据间差异程度的度量.距离越近距离越近,越越“亲密亲密”,聚成一类聚成一类;距离越远距离越远,越越“疏远疏远”,分别属于不同的类分别属于不同的类(2)(2)衡量对象衡量对象个体间距离个体间距离个体和小类间、小类和小类间的距离个体和小类间、小类和小类间的距离两个距离概念两个距离概念l按照远近程度来聚类需要明确两个概念:一个是点和点之间的距离,一个是类和类之间的距离。l点间距离有很多定义方式。最简单的是欧式距离,还有其他的距离。l当然还有一些和距离相反但起同样作用的概念,比如相似性等,两点越相似度越大,就相当于距离越短。l由一个点组成的类是最基本的类;如果每一类都由一个点组成,那么点间的距离就是类间距离。但是如果某一类包含不止一个点,那么就要确定类间距离,l类间距离是基于点间距离定义的:比如两类之间最近点之间的距离可以作为这两类之间的距离,也可以用两类中最远点之间的距离作为这两类之间的距离;当然也可以用各类的中心之间的距离来作为类间距离。在计算时,各种点间距离和类间距离的选择是通过统计软件的选项实现的。不同的选择的结果会不同,但一般不会差太多。SPSS中聚类分析分类(一)按分类对象 对变量的聚类称为R型聚类 对观测值聚类称为Q型聚类 这两种聚类在数学上是对称的,没有什么不同。(二)按聚类的方法分类 分层聚类或系统聚类分析 快速聚类分析 两步聚类分析:新型的事先不用确定分多少类:分层聚事先不用确定分多少类:分层聚类类分层聚类或系统聚类(hierarchical cluster)。开始时,有多少点就是多少类。l它第一步先把最近的两类(点)合并成一类,然后再把剩下的最近的两类合并成一类;l这样下去,每次都少一类,直到最后只有一大类为止。显然,越是后来合并的类,距离就越远。再对饮料例子来实施分层聚类。l对于一个数据,人们既可以对变量(指标)进行分类(相当于对数据中的列分类),也可以对观测值(事件,样品)来分类(相当于对数据中的行分类)。l比如学生成绩数据就可以对学生按照理科或文科成绩(或者综合考虑各科成绩)分类,l当然,并不一定事先假定有多少类,完全可以按照数据本身的规律来分类。快速聚类lk-均值聚类(k-means cluster,也叫快速聚类,quick cluster)却要求你先说好要分多少类。看起来有些主观l假定你说分3类,这个方法还进一步要求你事先确定3个点为“聚类种子”(SPSS软件自动为你选种子);也就是说,把这3个点作为三类中每一类的基石。l然后,根据和这三个点的距离远近,把所有点分成三类。再把这三类的中心(均值)作为新的基石或种子(原来的“种子”就没用了),重新按照距离分类。l如此叠代下去,直到达到停止叠代的要求.l适合处理大样本数据。l特点1.聚类分析前所有个体所属的类别是未知的,类别个数一般也是未知的,分析的依据只有原始数据,可能事先没有任何有关类别的信息可参考2.严格地,聚类分析并不是纯粹的统计技术,不象其他多元分析,需要从样本去推断总体l一般不涉及统计量分布,也不需显著性检验3.聚类分析更象是一种建立假设的方法,而对相关假设的检验还需要借助其他统计方法l注意1.聚类分析主要用于探索性研究,其分析结果可提供多个可能的解,最终解的选择需要研究者的主观判断和后续分析2.聚类分析的解完全依赖于研究者所选择的聚类变量,增加或删除一些变量对最终解都可能产生实质性的影响3.不管实际数据中是否存在不同的类别,利用聚类分析都能得到分成若干类别的解下面以对观测值聚类即Q型聚类为例演示用spss进行聚类分析的具体步骤:对一个班的数学水平进行聚类lQ型聚类,对样本也就是观察个案的聚类单击“方法”按钮弹出对话框l下拉框指定的是小类之间的距离计算方法7种供用户选择l度量标准计算样本距离的方法点击“继续”接下来指定SPSS分析图形输出属性图以树的形式展现聚类分析的每一次合并过程。冰柱图通过表格中的冰柱显示。可以指定并主图的输出方向,纵向和横向显示凝聚状态表,单击“统计量”l单一方案:输入一个具体数值n,n小于样本总数,表示仅显示聚类成n类时,个各类的成员构成l方案范围:指定显示聚成n1类到n2类时,个各类的成员构成。设定保存层次聚类分析的结果l无,是指不保存到编辑窗口中。l结果与讨论- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 聚类分析 具体操作 步骤
咨信网温馨提示:
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【胜****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【胜****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【胜****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【胜****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
关于本文