数据分析上机实验模拟题.doc
《数据分析上机实验模拟题.doc》由会员分享,可在线阅读,更多相关《数据分析上机实验模拟题.doc(15页珍藏版)》请在咨信网上搜索。
1、数据分析上机实验模拟题一第一章 数据的描述性分析 1建立数据集设有数据集如下: LIMING 23 56 170 LIUHUA 25 60 174 ZHANGWEI 30 65 165相应变量分别为NAME,AGE,WEIGHT和HEIGHT,输入数据以建立一个名为exe_1的SAS数据集,并打印输出2数据的描述性分析例1.2 对血清蛋白含量,利用PROC UNIVARITE过程,求数据的方差、标准差、变异系数、极差、四分位极差、四分位标准差,程序如下:练习:利用MEANS过程求上述基本统计量.二回归分析1线性回归模型及其参数估计(模型及矩阵表示、参数估计及性质); 矩阵表示 2统计推断(回归
2、方程的显著性检验、回归系数的显著性检验、预测及其置信区间、与回归系数有关的假设检验的一般方法); (1) 回归方程的显著性检验: , ,检验假设:,统计量,时,拒绝(2)回归系数的统计推断:检验假设,统计量 ,拒绝的置信区间:(3)预测及统计推断:的置信区间: 3残差分析及处理措施(误差的正态性检验、残差图分析、BoxCox变换);(1)误差的正态性检验1)残差正态性的频率检验2)残差的正态QQ图检验近似一条直线, (2)残差图分析 3)Box-Cox变换 选择,使最小4回归方程的选取 (1)穷举法评价回归方程优良性的准则:修正的复相关系数准则;准则,预测平方和准则 (2)逐步回归法例2.3某
3、科学基金会的管理人员欲了解从事研究工作的中、高水平的数学家的年工资额Y与他们的研究成果的质量指标、从事研究工作的时间以及能获得资助的指标为此按一定的设计方案调查了24位此类型的数学家,得数据如书上表2。3所示(1)假设误差服从分布,建立与之间的线性回归方程并研究相应的统计推断问题(2)假设某位数学家的关于的值为,试预测他的年工资额并给出置信度为95的置信区间三方差分析-单因素1.单因素方差分析(1)统计模型因变量Y因素,水平,上观测值 ,, (2) 显著检验 ,拒绝(3)置信区间 (略) 置信度的置信区间, 置信度的置信区间为个的置信度至少的同时置信区间2。双因素等重复试验下的方差分析(1)统
4、计模型Y因素和B,水平,,组合水平观测值 , 为无偏估计假设成立时,分别服从分布(2)显著检验假设检验问题: 统计量 检验值:如,拒绝相应假设 (3)无交互效应的各因素均值的估计与比较(4)有交互效应时因素各水平组合上的均值估计与比较例31 为比较同一类型的三种不同食谱的营养效果,将19只幼鼠分为三组,每组分别为8只、4只、7只,各采用这三种食谱喂养假定其他条件均保持相同,12周后测得其体重增加量如表3.3所示,设体重增加服从方差分析模型(3.1)或(3.2),试比较这三种食谱的营养效果是否有显著差异 表3.3 三种食谱下幼鼠的体重增加量 食谱 体重增加量 甲 164 190 203 205
5、206 214 228 257乙 185 197 201 231 丙 187 212 215 220 248 265 281 四主成分分析、典型相关分析1主成分分析(1)基于协方差矩阵的总体主成分的求法 (基于相关系数矩阵类似) -维随机变量,协方差阵 非负定主成分定义:满足:(1)系数向量单位化; (2)各主成分不相关,无重叠信息,;(3)主成分方差由此递减求总体主成分步骤:1)解,求的p个特征值;2)对应的正交单位化的特征向量分别为;其中 ,3)的第个主成分为 ;为个主成分构成的随机向量4)主成分的贡献率与累计贡献率第k个主成份的贡献率 前k个主成份的累积贡献率(2)基于样本协方差矩阵的主
6、成分分析(基于样本相关系数矩阵类似)来自于总体的容量为的样本观测数据 ,样本协方差矩阵其中 , 为的样本均值步骤:1)求特征值2)相应的正交单位化特征向量,3)第个样本主成分 , 4) 第k个样本主成分的贡献率 前k个主成分的累积贡献率5)第个样本主成分的个观测值称为第个样本主成分的得分,可以依据得分对各组样本观测数据进行排序()样本主成分的观测数据(得分向量)例4。3 对10名男中学生的身高()、胸围()、体重()进行测量,得数据如表4.2,从协方差矩阵出发对其做主成分分析,按照第一主成分排名表4.2 10名男中学生的身高、胸围及体重数据 序 号 身高x1(cm) 胸围x3(cm) 体重x3
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 分析 上机 实验 模拟
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【快乐****生活】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【快乐****生活】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。