多元统计分析-课程设计.doc
《多元统计分析-课程设计.doc》由会员分享,可在线阅读,更多相关《多元统计分析-课程设计.doc(27页珍藏版)》请在咨信网上搜索。
1、多元统计分析课程设计题目:因子分析在环境污染方面的应用姓名:王厅厅专业班级:统计学2014级2班学院:数学与系统科学学院时间:2016年1月 3 日目录1.摘要:12.引言:12.1背景12.2问题的研究意义12.3方法介绍23.实证分析103.1指标103.2原始数据103.3数据来源133.4分析过程:134.结论及建议255.参考文献261.摘要: 中国的环境问题,由于中国政府对环境问题的关注,环境法律日趋完善,执法力度加大,对环境污染治理的投人逐年有较大幅度的增加,中国环境问题已朝着好的方面发展。但是,仍存在着环境问题,主要体现在环境污染问题,其中主要为水污染和大气污染。关键词:环境污
2、染 水污染 大气污染 因子分析2.引言:2.1背景:我国的环境保护取得了明显的成就,部分地区环境质量有所改善。但是,从整体上看,我国的环境污染仍在加剧,环境质量还在恶化。大气二氧化硫含量居高不下,境质量呈恶化趋势,固体废弃物污染量大面广,噪声扰民严重,环境污染事故时有发生。据中国社会科学院公布的一项报告表明:中国环境污染的规模居世界前列。2.2问题的研究意义:为分析比较各地环境污染特点,利用因子分析对环境污染的各个指标进行降维处理并得到影响环境的内在因素,进一步对环境污染原因及治理措施进行分析,让更多的人认识到环境的重要性,准确把握各地区环境治理方法以及针对不同地区制定不同的政策改善环境问题,
3、这对综合治理环境问题具有重要意义。2.3方法介绍因子分析的意义:变量间的信息的高度重叠和高度相关会给统计方法的应用设置许多障碍。为解决此问题,最简单和最直接的解决方案是削减变量个数,但这必然会导致信息丢失和信息不完全等问题的产生。为此人们希望探索一种更有效地解决方法,它既能大幅减少参与数据建模的变量个数,同时也不会造成信息的大量丢失。因子分析正是这样一种能够有效降低变量维数的分析方法。因子分析的步骤:因子分析的前提条件:要求原有变量之间存在较强的相关关系。因子提取:将原有变量综合成少数几个因子是因子分析的核心内容。 若存在随机向量及,使简记为,且(1)(标准化);(2)(中心化);(3)(不相
4、关)。那么,称指标向量具有正交因子结构(所有因子相互正交,即);称此模型为正交因子模型;称为公共因子(对整个有影响的公共因素);称为特殊因子(只对的各对应分量有影响的特殊因素);称为因子载荷矩阵,为第个指标在第个公共因子上的载荷。因子载荷矩阵的建立因子分析的最基本任务之一就是建立因子载荷矩阵。对于正交因子模型,有若已标准化,则在绝大多数实际问题中,往往都是未知的,由此求出是不可能的,这时可以通过主成分分析给出一组公共因子及其因子载荷矩阵。具体方法如下:(1)求出的特征根,以及相应的单位特征向量。(2)建立主成分。是正交矩阵。(3)构造公共因子,并建立因子载荷矩阵。 (逆问题)令 容易验证: 具
5、有如下正交因子结构: (?)完全忽略了特殊因子的影响。若只取前个主成分,且令,则有其中。忽略了不重要的公共因子,由特殊因子解析。换句话说,用主成分法获得了的正交因子分解(近似)中的。这里的主要问题是如何确定因子数k方法一:根据特征值确定因子数。观察各个特征值,一般取特征值大于1的。方法二:根据因子的累计方差贡献率确定因子数。 通常选取累计方差贡献率大于0.85时的特征值个数为因子个数k。使因子具有命名解释性实际分析工作中人们总是希望对因子的实际含义有比较清楚的认识。未解决这个问题,可通过因子旋转的方法使一个变量只在尽可能少的几个因子上有比较高的载荷。最理想状态下,使某个变量在某个因子上的载荷趋
6、于1,在其他的因子上的载荷趋于0。这样,一个因子就能够成为某个变量的典型代表,于是因子的实际含义也就清楚了。 因子正交旋转当指标向量具有正交因子结构时,其公共因子向量、因子载荷矩阵及正交因子分解均不唯一确定。对任一阶正交矩阵,有令则利用正交因子分解的这一性质,在因子分析(正交因子模型)中,常常在建立了初始因子载荷矩阵之后,再对其作适当的正交变换(几何解释:因子轴旋转),以使得因子载荷矩阵具有更简洁、更理想(近乎分块对角矩阵形式)的结构,公共因子向量具有更明显、更直观的实际意义,正交因子分解更合理、更能反映客观实际。目前,已经提出了各种因子旋转的方法。比较常用的一种是方差极大因子轴正交旋转法,简
7、称方差极大法。先考虑两个公共因子的平面正交旋转。 具有更理想、更简化的结构,即使其各列的因子载荷值尽可能地两极分化,大者尽可能大,小者尽可能小。各载荷值可正可负,的依赖程度也不同,消除其影响:(规格化)正交旋转的目的就是要使新因子载荷矩阵的各列方差之和(总方差)达到最大。记则可由下式确定:tg且的符号可由的符号确定:当公共因子数时,需要对因子载荷矩阵中的列因子载荷向量配两两对旋转,共旋转次。列。先确定,后旋转。仅列元素改变。全部列两两配对旋转完毕后,就完成了第一轮旋转。如果因子载荷矩阵还不能达到要求,那么进行第二轮旋转,如此进行下去,直到满足要求为止。每经一轮旋转,都可算出因子载荷矩阵的总方差
8、。是一非降序列,且有上界(为),故必收敛于某一极限值,即为最大总方差。实际中,通常旋转到总方差改进不大,即(给定精度)时,旋转停止。最后,取作为最终因子载荷矩阵。计算因子得分因子得分是因子分析的最终体现。在因子分析的实际应用中,当因子确定以后,便可计算各因子在每个样本观测上的具体数值,这些数值称为因子得分,形成的变量称为因子得分变量。于是,在以后的分析中就可以因子得分变量代替原有变量进行数据建模,或利用因子得分变量对样本进行分类或评价等研究,进而实现降维和简化问题的目的。 ,3.实证分析3.1指标:废水排放总量、需氧量排放总量、氨氮排放总量、二氧化硫排放总量、氮氧化物排放总量、烟尘灰尘排放总量
9、3.2原始数据:地区废水排放总量化学需氧量排放总量氨氮排放总量二氧化硫排放总量氮氧化物排放总量烟尘灰尘排放总量北京15.0716.881.97.8915.15.74天津8.9421.432.4520.9228.2313.95河北30.98126.8510.27118.99151.25179.77山西14.544.135.37120.82106.99150.68内蒙古11.1984.774.93131.24125.83102.15辽宁26.29121.710.0199.4690.2112.07吉林12.2274.35.3137.2354.9247.51黑龙江14.96142.398.4947.2
10、273.0679.35上海22.1222.444.4618.8133.2814.17江苏60.1211014.2590.47123.2676.37浙江41.8372.5410.3257.468.7937.97安徽27.2388.5610.0549.380.7365.28福建26.0662.988.9335.641.1736.79江西20.8372.018.653.4454.0146.23山东51.44178.0415.5159.02159.33120.81河南42.28131.8713.9119.82142.288.21湖北30.17103.3112.0458.3858.0250.4湖南311
11、22.915.4462.3755.2849.62广东90.51167.0620.8273.01112.2144.95广西21.9374.47.9346.6644.2440.29海南3.9419.62.293.269.52.32重庆14.5838.645.1352.6935.522.61四川33.13121.6313.4779.6458.5442.86贵州11.0932.673.892.5849.1137.79云南15.7553.385.6563.6749.8936.68西藏0.542.790.340.424.831.39陕西14.5850.495.8278.170.5870.91甘肃6.637
12、.323.8157.5641.8434.58青海2.310.50.9815.4313.4523.99宁夏3.7321.981.6637.7140.423.92新疆10.2767.024.5985.386.2881.393.3数据来源:中国环境年鉴3.4分析过程: 利用SPSS软件进行分析,首先录入数据,然后一次进行如下处理:一、考察原有变量是否适合进行因子分析 首先考察收集到的原有变量之间是否存在一定的线性关系,是否适合采用因子分析。这里借助变量的相关系数矩阵进行分析。表一是原有变量的相关系数矩阵。可以看到:大部分的相关系数都较高,各变量呈较强的线性关系,能够从中提取公共因子,适合进行因子分析
13、。表一相關性矩陣废水排放总量 单位:亿吨化学需氧量排放总量 单位:万吨氨氮排放总量 单位:万吨二氧化硫排放总量 单位:万吨氮氧化物排放总量 单位:万吨烟尘灰尘排放总量 单位:万吨相關废水排放总量 单位:亿吨1.000.762.913.424.612.277化学需氧量排放总量 单位:万吨.7621.000.906.647.773.592氨氮排放总量 单位:万吨.913.9061.000.519.650.394二氧化硫排放总量 单位:万吨.424.647.5191.000.903.842氮氧化物排放总量 单位:万吨.612.773.650.9031.000.864烟尘灰尘排放总量 单位:万吨.27
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 统计分析 课程设计
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【人****来】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【人****来】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。