主成分分析计算方法和步骤.doc
《主成分分析计算方法和步骤.doc》由会员分享,可在线阅读,更多相关《主成分分析计算方法和步骤.doc(10页珍藏版)》请在咨信网上搜索。
(完整版)主成分分析计算方法和步骤 主成分分析计算方法和步骤: 在对某一事物或现象进行实证研究时,为了充分反映被研究对象个体之间的差异, 研究者往往要考虑 增加测量指标,这样就会增加研究问题的负载程度。但由于各指标都 是对同一问题的反映,会造成信息的重叠,引起变量之间的共线性,因此,在多指标的数 据分析中,如何压缩指标个数、压缩后的指标能否充分 反映个体之间的差异,成为研究 者关心的问题.而主成分分析法可以很好地解决这一问题。 主成分分析的应用目 的可以简单地归结为: 数据的压缩、数据的解释.它常被用来寻 找和判断某种事物或现象的综合指标,并 且对综合指标所包含的信息给予适当的解释, 从而更加深刻地揭示事物的内在规律。 主成分分析的基本步骤分为: ①对原始指标进行标准化,以消除变量在数量极或量 纲上的影响;②根据标准化后的数据矩阵求出相关系数矩阵 R; ③求出 R 矩阵的特征 根和特征向量; ④确定主成分,结合专 业知识对各主成分所蕴含的信息给予适当的解 释;⑤合成主成分,得到综合评价值。 结合数据进行分析 本题分析的是全国各个省市高校绩效评价,利用全国2014年的相关统计数据(见附录),从相关的指标数据我们无法直接评价我国各省市的高等教育绩效,而通过表5—6的相关系数矩阵,可以看到许多的变量之间的相关性很高。如:招生人数与教职工人数之间具有较强的相关性,教育投入经费和招生人数也具有较强的相关性,教工人数与本科院校数之间的相关系数最高,到达了0.963,而各组成成分之间的相关性都很高,这也充分说明了主成分分析的必要性。 表5-6 相关系数矩阵 本科院校数 招生人数 教育经费投入 相关性 师生比 0.279 0.329 0。252 重点高校数 0。345 0.204 0.310 教工人数 0。963 0.954 0.896 本科院校数 1。000 0。938 0。881 招生人数 0.938 1。000 0。893 教育经费投入 0.881 0。893 1.000 师生比 重点高校数 教工人数 相关性 师生比 1.000 —0.218 0。208 重点高校数 -0.218 1。000 0。433 教工人数 0.208 0。433 1.000 本科院校数 0。279 0。345 0。963 招生人数 0.329 0。204 0.954 教育经费投入(元) 0。252 0。310 0。896 表5-7给出的是各主成分的方差贡献率和累计贡献率,我们选取主成分的标准有两个:第一,特征根大于1,因为,如果特征根小于1,说明该主成分的解释力度太弱,还比不上直接引入一个原始变量的平均解释力度大;第二,方差贡献率大于85%,如果这两个标准不能同时符合要求,则往往是因为选择的指标不合理或者样本容量太小,应继续调整。表5—7还显示,只有前2个特征根大于1,因此SPSS只提取了前两个主成分,而这两个主成分的方差贡献率达到了87.081%,因此选取前两个主成分已经能够很好地描述我国高等教育地区现状。 表5—7 方差贡献率以及累计贡献率 元件 起始特征值 提取平方和载入 合计 方差的贡献率 % 累加贡献率 % 合计 方差的贡献率 % 累加贡献率 % 1 3。983 66。390 66.390 3。983 66.390 66。390 2 1。241 20.691 87。081 1。241 20。691 87。081 3 0.571 9。508 96。589 。571 9.508 96。589 4 0.140 2。335 98.925 。140 2。335 98。925 5 0。052 0.869 99。794 。052 0.869 99。794 6 0.012 0.206 100.000 .012 0.206 100.000 表5—8为输出的主成分系数矩阵,可以说明各主成分在各变量上的载荷。由表5—8 可以看出,标准化后的第一主成分( 简称) 对所有变量都有载荷,且载荷绝对值几乎都在0.7以上, 因此可以说第一主成分是对人口结构的度量,代表了一个地区人口结构状况,可以称之为“综合因子".在综合因子中,平均每户人口,农业与非农业人口比例, 人口的自然增长率比重即 人口自然增长各指标具有较强的作用,人与经济等其他指标所起的作用次之,男女比例也起一定作用.第二主成分( 简称 ) 对重点高校数和教工人数具有负载荷,其他变量具有正载荷,并且除 师生比和重点高校数载荷绝对值均小于0。2,有的甚至 接近于 0.1。因此,第二个主成分只是汇集了第一主成分遗漏的部分信息,我们称之为“辅助 因子”。 表5-8主成分矩阵 成分 师生比 0。317 0.799 重点高校数 0。396 —0。759 教工人数 0。984 -0。095 本科院校数 0。973 0。005 招生人数 0。964 0。131 教育经费投入 0。939 0。011 表5-9 主成分评分系数矩阵 成分 师生比 。079 .643 重点高校数 。099 -。612 教工人数 。247 -。077 本科院校数 。244 .004 招生人数 。242 。106 教育经费投入 .236 .009 根据表5—9可以得到各主成分的表达式 把变量分别代入以上表达式,可以得出和两个主成分得分,但单独一个主成分不能很好地评价十个地区人口结构的情况,因此需要按照各主成分对应的方差贡献率为权数计算综合统计F,() 主成分分析法的优点: 1、 可消除评价指标之间的相关影响 因为主成分分析在对原指标变量进行变换后形成了彼此相互独立的主成分,而且实践证明指标之间相关程度越高,主成分分析效果越好. 2、 可减少指标选择的工作量 对于其它评价方法,由于难以消除评价指标间的相关影响,所以选择指标时要花费不少精力,而主成分分析由于可以消除这种相关影响,所以在指标选择上相对容易些. 3、 当评级指标较多时还可以在保留绝大部分信息的情况下用少数几个综合指标代替原指 标进行分析 主成分分析中各主成分是按方差大小依次排列顺序的,在分析问题时,可以舍弃一部分主成分,只取前后方差较大的几个主成分来代表原变量,从而减少了计算工作量. 4、 在综合评价函数中,各主成分的权数为其贡献率,它反映了该主成分包含原始数据的信 息量占全部信息量的比重,这样确定权数是客观的、合理的,它克服了某些评价方法中认为确定权数的缺陷. 5、 这种方法的计算比较规范,便于在计算机上实现,还可以利用专门的软件 主成分分析法的缺点: 1、在主成分分析中,我们首先应保证所提取的前几个主成分的累计贡献率达到一个较高的水平(即变量降维后的信息量须保持在一个较高水平上),其次对这些被提取的主成分必须都能够给出符合实际背景和意义的解释(否则主成分将空有信息量而无实际含义). 2、主成分的解释其含义一般多少带有点模糊性,不像原始变量的含义那么清楚、确切,这是变量降维过程中不得不付出的代价。因此,提取的主成分个数m通常应明显小于原始变量个数p(除非p本身较小),否则维数降低的“利”可能抵不过主成分含义不如原始变量清楚的“弊”. 四、一辈子孤单并不可怕,如果我们可以从中提炼出自由,那我们就是幸福的。许多长久的关系都以为忘记了当初所坚持与拥有的,最后又开始羡慕起孤单的人. 五、恋爱,在感情上,当你想征服对方的时候,实际上已经在一定程度上被对方征服了.首先是对方对你的吸引,然后才是你征服对方的欲望。 六、没有心如刀割,不再依依不舍,只有,沉默相隔…… 七、和你在一起只是我不想给任何人机会。 八、一个人总要走陌生的路,看陌生的风景,听陌生的歌,然后在某个不经意的瞬间,你会发现,原本是费尽心机想要忘记的事情真的就那么忘记了。 九、无论我们爱过还是就这样错过,我都会感谢你。因为遇见你,我才知道思念一个人的滋味;因为遇见你,我才知道感情真的不能勉强;因为遇见你,我才知道我的心不是真的死了;因为遇见你,我才知道我也能拥有美丽的记忆。所以,无论你怎么对待我,我都会用心去宽恕你的狠,用心去铭记你的好。 十、爱情需要的是彼此互相的照顾,当我们心爱的人累了,我们不是坐在一边不理,而是多陪对方谈谈心,对方需要什么的时候,自己尽量的满足对方的需求,至少可以让对方知道,在自己身边的感觉是如此的温暖。 十一、自从你出现後,我才知道原来有人爱是那麽的美好 十二、有的人与人之间的相遇就像是流星,瞬间迸发出令人羡慕的火花,却注定只是匆匆而过。 十三、有一些人,这一辈子都不会在一起,但是有一种感觉却可以藏在心里守一辈子. 十四、不要轻易说爱,许下的承诺就是欠下的债! 十五、不管你是多么的爱对方,但千万不可当第三者.细想,默然。因为知道,这样的故事一开始便注定了结局,一开始就注定在这个故事里,很多人会受伤。离开的总是要离开,挽留不住,就像彼岸花,穷其一生,花叶仍是生生相错。 十六、什么叫快乐?就是掩饰自己的悲伤对每个人微笑。 十七、爱情与视力无关,任你看得再怎么清楚,在爱里只有模糊。因为太聪明太理智就没有办法恋爱,爱情根本是盲目的。 十八、恋爱就像剪头发,这种事情不到最后是不知道结果的,结果能否令每个人皆大欢喜,无人保障,但是一切都是自己的选择. 十九、因为爱过,所以慈悲:因为懂得,所以宽容。 二十、那些随风散落的微笑眼神,仿似落寞诗人的爱情诗句,一段一段,错落成行。孤独的钟鸣彻夜悲鸣,那些如花容颜,终不敌过时间切割的颓败,我们忧伤的仰望阳光,看流年未亡,年华尽耗。 二十一、一个人一生可以爱上很多的人,等你获得真正属于你的幸福之后,你就会明白一起的伤痛其实是一种财富,它让你学会更好地去把握和珍惜你爱的人。 二十二、爱一个人,由天由人却由不得自己.不由自主只因刻骨铭心,不离不弃只因无法代替.总是心有期待,才有灯火阑珊处的望眼等待;总是情怀善待,才有心甘情愿地付出所有,习惯的依赖。也许你的世界一无所有,但在爱你人的心里,你就是全世界.珍惜一个深爱你的人,更要珍藏一颗为你融入生命的心。 二十三、就在我以为一切都没有改变只要我高兴就可以重新扎入你的怀抱一辈子不出来的时候,其实一切都已经沧海桑田了,我像是一躲在壳里长眠的鹦鹉螺,等我探出头来打量这个世界的时候,我原先居住的大海已经成为高不可攀的山脉,而我,是一块僵死在山崖上的化石 二十四、幸福,不是长生不老,不是大鱼大肉,不是权倾朝野。幸福是每一个微小的生活愿望达成.当你想吃的时候有得吃,想被爱的时候有人来爱你. 二十五、有时,爱也是种伤害.残忍的人,选择伤害别人,善良的人,选择伤害自己。 二十六、如果,不幸福,如果,不快乐,那就放手吧;如果,舍不得、放不下,那就痛苦吧. 二十七、这个世界就这么不完美。你想得到些什么就不得不失去些什么。 二十八、有的人与人之间的相遇就像是流星,瞬间迸发出令人羡慕的火花,却注定只是匆匆而过。 二十九、无数次在梦的意境,勾勒你的样子,那样的虔诚,和你的心灵一样,一生刻骨. 三十、有人背叛你,你却想挽回.有人不爱你,你却讨好他。何必为爱委屈自己。一个人如真心爱你,绝不会对你忽冷忽热;一个人如真心想追你,绝不会跟你玩暧昧。与其卑微的恋爱,不如选择单身。- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 成分 分析 计算方法 步骤
咨信网温馨提示:
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【天****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【天****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【天****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【天****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
关于本文