应用多元统计方法对部分省市经济发展的研究-应用统计学课程设计.doc
《应用多元统计方法对部分省市经济发展的研究-应用统计学课程设计.doc》由会员分享,可在线阅读,更多相关《应用多元统计方法对部分省市经济发展的研究-应用统计学课程设计.doc(24页珍藏版)》请在咨信网上搜索。
1、 课程设计论文应用多元统计方法对部分省市经济发展的研究The Research of College Students Grades by Multivariate Statistical Method学 院:理学院专 业:应用统计学姓 名:徐茂发 指导教师:周兰锁职 称:讲 师论文提交日期:二一七年五月摘 要随着时代的发展和社会的进步,人们对人力资源的开发越来越重视,用人单位在跳远人才时,对应聘者的科学文化水平和知识结构要求越来越高,特别是随着高等教育的迅速发展、招生规模的不断扩大,知识的快速更新,对生源结构和教师结构都产生了很大的影响。作为人才培养的高地,高等学校如何提高教学质量,为社会培
2、养有用的高级人才,一直是教育界研究的重要课题。 本文抽取2013级理学院统计学专业一班36名学生和2012级理学院统计学专业一班28名学生的大二学年成绩作为样本,运用聚类分析,因子分析的多元统计方法以及采用SPSS19.0分析软件对数据进行定量的分析。首先采用了统计方法对原始数据进行了预处理,采用聚类分析方法把学生分为四大类,然后用因子分析方法把繁多的课程总结成两大主因子,给出了因子得分模型。通过分析研究,我们得出,学生的总成绩高低并不能反映学生能力的大小,通过权衡各科比重,得到学生综合成绩,才能反映学生真正学习能力。而且通过因子分析,也可以看出学生比较薄弱的科目,也对今后教学给出了侧重点。关
3、键词:多元统计 聚类分析 因子分析 The Research of College Students Grades by Multivariate Statistical MethodAbstractWith the development of the times and social progress, people pay more and more attention to the development of human resources, the employing units in the selection of personnel, which requests appli
4、cant more and more high level in the scientific and cultural level and knowledge structure. Especially with the rapid development of high education, expanding enrollment and rapid updating of knowledge which bad a great influence on students and teacher structure. As training ground, has always been
5、 an important research subject in the educational circles, for how to improve the teaching quality of higher education and the training of high-level personnel useful to society. This paper bases on the grades of the 36 students from class one of 2013 professional faculty of science statistics and t
6、he grades of the 28 students from class one of 2012 professional faculty of science statistics. It applies cluster analysis, multivariate statistical methods of factor analysis and SPSS19.0 analysis software for quantitative analysis of the data. First, it adapts the original data to get grade point
7、 pretreatment and uses cluster analysis method to divide the students into 4 parts. Then, it uses factor analysis method to divide the wide range of courses into 2 parts, which gives the factor score model. Finally, it uses statistical analysis methods to have strengths and weaknesses of students gr
8、ades on the courses. This can help to promote teachers targeted teaching and improve the quality of the courses.Key words: Multivariate statistics;Cluster analysis;Factor statistical;SPSS19.0目 录1 引言11.1 概述11.2 研究背景与意义11.3 国内研究现状11.4 数据来源21.5 数据的预处理22 聚类分析32.1 聚类分析的基本思想32.2 聚类分析结果33 因子分析43.1 因子分析法的数学
9、模型43.2 因子分析法的基本步骤64.3 因子分析的应用64.3.1 KMO检验64.3.2 因子陡坡检查,除去坡线平坦部分的因子74.3.3 方差贡献率检验74.3.4 显示未旋转的因子矩阵84.3.5 因子旋转正交旋转94.3.6 因子得分系数矩阵104.3.7 综合得分指标函数104.3.8 综合排名的比较105 统计方法的应用135.1 学生成绩的比较性别对学生成绩的影响135.1.1 独立样本T检验136 总结14致谢15参考文献16附录.17插图和附表清单 表1 必修课程名称2表2 KMO检验与Bartlett球形检验6表3 因子分析共同度6表4 因子方差分析的总解释7表5 未旋
10、转后因子载荷矩阵8表6 旋转后因子载荷矩阵9表7 因子结构9表8 因子得分系数矩阵10表9 综合得分及排名11表10 综合排名及总分排名比较12表11 独立样本T检验13表12 男女学生成绩情况14图1 聚类分析图3图2 碎石图7内蒙古农业大学课程设计论文171 引言1.1 概述多元统计分析的理论是最近发展起来的理论学科,人们对它的研究还很不善有很多新的统计分析方法还没有得到人们的重视,虽然有的统计方法在理论上得到认可,但是在实际应用中不是很广泛.多元统计分析在经济、金融、医药等领域应用比较广泛,但是在教育教学上的应用却受到了限制.尤其是一些普通教师没有真正认识到它的有用性,这种想法是不可取的
11、.多元统计分析在教育领域没有得到很好的应用,主要原因是进行教育教学研究的学者对统计理论掌握的不深,不知道统计结果在教育教学上说明什么;另一方面,对数据有一种恐惧感,尤其是对大量的原始数据不会处理;再就是对计算机的使用有一定的障碍,即不会使用统计软件等。基于以上原因,本文就是想利用多元统计分析软件SPSS,对所涉及到的高等院校的各个领域进行探讨,每个领域都要用到多元统计分析方法对数据进行处理,通过统计分析得到的结论去指导学生成绩的评价,同时也给老师和职能部门进行决策提供理论依据。1.2 研究背景与意义学生的个性特征和群体分类特征是学生管理工作中非常重要的信息,尤其是毕业生,需要对他们做出综合评价
12、,以向用人单位提供学生的各方面特征信息。目前,对学生综合评价的一般模型主要有平均分模型、平均学分积模型等。另外,多元统计分析中的聚类分析、因子分析等也是很好的综合评价方法,但大多数大学或院系都是用前两种模型即平均成绩、平均学分积模型作为评价学生的定量依据。用这两种方法比较简单,但有缺点,掩盖了学生的个性,不能反映学生各方面的特点,也反映不出学生的专业能力,对学生作全面的综合评价来说不是很理想。因此,本文着重突出因子分析方法,力求通过成绩给学生一个相对完美的评价。目前对大学生成绩评定方法的研究取得了很大的进展,主要成果有:比例制、考查制、学分制、德育考评制度等。大学生四年学习成绩是大学四年学习生
13、活的记录,这些记录基本反映了该生四年的学习情况,但在高校学生管理中,经常需要从各方面评价学生的成绩,如评奖学金、向用人单位推荐分配学生等,都需要从各方面评价学生成绩,多元统计分析方法已有应用。1.3 国内研究现状多元统计分析已广泛地应用到社会科学和自然科学的许多领域中。特别是在经济、金融、医药等领域应用比较广泛,但是关于多元统计分析在高校教学中的应用,前人作了很多工作.但是他们所阐述的都是具体针对某一方面的应用,只解决了某一方面的问题,在利用多元统计方法上也受到了某种局限性,大部分文献所利用的多元统计方法都是单一的,没有多种方法结合起来应用,使得在研究过程中得出的结论说理性不强;在进行统计分析
14、时所利用的统计软件版本比较老,给分析带来了限制,如果用最新版本的软件可能得到更多的统计信息;文献中所得到的分析结果没有得到很好的解释和说明.另外,文献中出现了两个极端,一但是在教育教学上的应用却受到了一定的限制。尤其是一些普通高校教师在教学管理上很少应用,以至于影响了他们的工作效率。利用社会科学统计软件包SPSS,对高等师范院校教师所涉及到的各个领域进行探讨,能使高校教师的教学工作有的放矢。成绩作为考试的结果,不仅是对学生学业和教师教学效果的检验和评定,具有激励学生学习及教师工作,更是一种信息,具有反馈教学活动、服务于教育决策、为教育科研提供资料等作用。为充分发挥考试的效能,综合评价考试质量,
15、及时反馈教学效果,沟通教学信息,教学部门对考试成绩进行统计分析和总结是非常必要的。1.4 数据来源以内蒙古农业大学理学院2013级应用统计学专业的36名学生和2012级理学院统计学专业一班28名学生大二两学期的期末考试成绩为样本,将64名同学看做是64个观测值,按照他们的学号将2013级学生依次编号为1,2,3,36;将2012级学生依次编号为37,38,39,64。将这10门课程看做是10个指标,下图表1就给出了这一学期的10门课程。 表1 必修课程名称Table1 The title of required courseX1 数学分析X2 概率论X3 数理统计X4 常微分方程X7 马克思主
16、义原理X10 大学英语4X5 抽样调查X8 毛泽东思想和中国特色社会主义理论体系概论X6 应用随机过程X9 大学英语31.5 数据的预处理虽然每门课程的成绩都为学生在大学里的表现提供了一定的信息,但各门课程的学分不一样,其重要性不一样,为了减少误差,我们将每门课程的学分在总学分中所占的比重作为课程重要性的衡量标准,在用统计方法对成绩分析之前,先要对原始数据进行预处理,将每门课程的成绩乘以该课程在总课程中的比重,表达式为上式中表示第名同学的第门课程的原始成绩,表示第门课程的学分,表示总学分,为预处理后的成绩。下面先应用聚类分析将学生的学习成绩做一个大致分类,看看整体的状况,然后应用因子分析给出学
17、生成绩的综合评价模型1。2 聚类分析2.1 聚类分析的基本思想聚类分析是依据实验数据本身所具有的定性或定量的特征来对大量的数据进行分组归类以了解数据集的内在结构,并且对每一个数据集进行描述的过程。其主要依据是聚到同一个数据集中的样本应该彼此相似,而属于不同组的样本应该足够不相似。聚类分析根据分类对象的不同可划分为型聚类分析和型聚类分析。型聚类是指对变量进行聚类,型聚类是指对样本进行聚类;根据处理方法的不同又分为:系统聚类法、图论聚类法、有序样品聚类法、动态聚类法、模糊聚类法等等2。2.2 聚类分析结果通过SPSS19.0对学生成绩进行聚类分析,距离采用欧式距离,类间距采用平均距离,结果如下表所
18、示:图1 聚类分析图Fig.1 Dendrogram如图所示,把研究对象分为了四大类:第一类:3,35,7,11,20,24,27,5,4,23,49,61,40,46,44,28,59,42,53,16,19,18,36,6,21,41第二类:25,34,15,26,1,57,60,48,64,56,31,55,10,13,47,30,22,62,2,8,50,9,32,12,39,51,38,43,52,37,58,45,54第三类:14,33,17,29第四类:63由此可知:第一类学生成绩优秀,第二类学生成绩良好,第三类学生的成绩为合格,第四类学生的成绩为不合格。从分类结果看出,统计学专
19、业的学生在这一学年的成绩整体相当不错,仅有一位同学的成绩不合格,与实际情况一致。3 因子分析3.1 因子分析法的数学模型假设有个样品,每个样品有个指标,这个指标之间有较强的相关性。为了便于研究,并消除由于观测量纲的差异及数量级不同所千万的影响,将样本观测数据进行标准化处理,合标准化后的变量均值为0,方差为1。为方便,把原始变量及标准化后的变量向量均用X表示,用 表示标准化的公共因子。如果:(1)是可观测随机向量,其均值向量E(X)=0,协方差矩阵cov(X)=,且协方差矩阵与相关阵列R相等;(2)是不可观测的变量,其均值向量E(F)=0,协方差矩阵cov(F)=I,即向量F的各分量是相互独立的
20、;(3)与F相互独立,且E()=0,的协方差阵是对角方阵即的各分量之间也是相互独立的,则模型称为因子模型。模型(2.1)的矩阵形式为:X=AF+其中 称为因子载荷矩阵,称为因子载荷,表示第变量在第因子上载荷,的绝对值越大,表明变量与因子的依赖性越大,也可说因子对变量的载荷越大3。3.2 因子分析法的基本步骤因子分析主要分三大步:一是对原始变量进行分析,看其是否适合做因子分析;二是确定因子变量;三是计算因子得分。本文采用因子分析法确定公共因子。具体步骤如下2:(1)检验:确认分析的原变量是否适合做因子分析。做检验和巴特利特球度检验,统计量是用于比较变量之间相关程度的一个指标, 值越接近1,相关程
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 多元 统计 方法 部分 省市 经济发展 研究 统计学 课程设计
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【可****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【可****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。