R语言学习系列28-协方差分析.doc
《R语言学习系列28-协方差分析.doc》由会员分享,可在线阅读,更多相关《R语言学习系列28-协方差分析.doc(11页珍藏版)》请在咨信网上搜索。
1、(完整版)(完整word)R语言学习系列28-协方差分析23. 协方差分析一、基本原理1. 基本思想在实际问题中,有些随机因素是很难人为控制的,但它们又会对结果产生显著影响.如果忽略这些因素的影响,则有可能得到不正确的结论.这种影响的变量称为协变量(一般是连续变量). 例如,研究3种不同的教学方法的教学效果的好坏.检查教学效果是通过学生的考试成绩来反映的,而学生现在考试成绩是受到他们自身知识基础的影响,在考察的时候必须排除这种影响. 协方差分析将那些难以控制的随机变量作为协变量,在分析中将其排除,然后再分析控制变量对于观察变量的影响,从而实现对控制变量效果的准确评价。协方差分析要求协变量应是连
2、续数值型,多个协变量间互相独立,且与控制变量之间没有交互影响。前面单因素方差分析和多因素方差分析中的控制变量都是一些定性变量,而协方差分析中既包含了定性变量(控制变量),又包含了定量变量(协变量)。协方差分析在扣除协变量的影响后再对修正后的主效应进行方差分析,是一种把直线回归或多元线性回归与方差分析结合起来的方法,其中的协变量一般是连续性变量,并假设协变量与因变量间存在线性关系,且这种线性关系在各组一致,即各组协变量与因变量所建立的回归直线基本平行.当有一个协变量时,称为一元协方差分析,当有两个或两个以上的协变量时,称为多元协方差分析。2. 协方差分析需要满足的条件 (1)自变量是分类变量,协
3、变量是定距变量,因变量是连续变量;对连续变量或定距变量的协变量的测量不能有误差;(2)协变量与因变量之间的关系是线性关系,可以用协变量和因变量的散点图来检验是否违背这一假设;协变量的回归系数(即各回归线的斜率)是相同的,且不等于0,即各组的回归线是非水平的平行线。否则,就有可能犯第一类错误,即错误地接受虚无假设;(3) 自变量与协变量相互独立,若协方差受自变量的影响,那么协方差分析在检验自变量的效应之前对因变量所作的控制调整将是偏倚的,自变量对因变量的间接效应就会被排除;(4)各样本来自具有相同方差2的正态分布总体,即要求各组方差齐性.二、协方差理论1。 观测值=均值+分组变量影响+协变量影响
4、+随机误差。 即 (1)其中,为所有协变量的平均值.注:在方差分析中,协变量影响是包含在随机误差中的,在协方差分析中需要分离出来。用协变量进行修正,得到修正后的yij(adj)为就可以对yij(adj)做方差分析了.关键问题是求出回归系数. 2. 总离差=分组变量离差+协变量离差+随机误差,(1)计算总离差平方和时,记总离差平方和:最终要检验分组自变量对因变量有无显著作用。原假设H0:无显著作用。假设检验是在H0为真条件下进行,可认为ti=0,则按最小二乘法原理线性回归可得到的估计值记修正的总离差平方和(残差平方和)为Tyy(adj),则,自由度为n-2注:为回归平方和,若(回归线为水平线),
5、表示协变量x对y无作用,用方差分析就可以解决了.(2)计算组内离差平方和时,记组内总离差平方和:根据协方差分析的基本假设:各组内回归系数相等(做协方差分析时需要检验这一点),得到组内回归系数w的估计值记修正的组内总离差平方和(组内残差平方和)为Eyy(adj), 则, 自由度为nk1其中,为组内回归平方和,当时,组内总离差平方和认为完全是由随机因素引起的,Eyy(adj)就是随机为误差。这里的是的加权平均值。(3)计算分组变量离差平方和Byy(adj),它反映的是各个水平之间的差异。即,分组变量离差=总离差协变量离差-随机误差.于是,就可以进行组间无差异检验了:3. 因此,在做协方差分析前,需
6、要依次做两个假设检验:(1)协变量对因变量的影响对与各组来说都是相同的,即各组回归系数相等:;步骤: 先按回归系数相等和不相等分别表示模型并计算出误差平方和其中,. 计算F值若F值小于临界值F,则说明各组回归系数无显著差异(相等)。(2)这些相等的回归系数。即采用一元线性回归的显著性检验,4. 协方差分析的步骤(1)检验数据是否满足假设条件:正态分布性、方差齐性、各分组通过协变量预测因变量的回归斜率相同;(2)检验效应因子的显著性;(3)估计校正的组均值;(4)检验校正的组均值之间的差异。三、R语言实现 协方差分析要求数据满足:正态性、方差齐性、各分组通过协变量预测因变量的回归斜率相同。R语言
7、用aov()函数进行协方差分析,基本格式为:aov(formula, data, 。.)其中,data为数据框;formula为协方差公式形式,形如yx+A, x为连续型协变量,A为组别因子.例1 研究分别接受了3种不同的教学方法的3组学生,在数学成绩上是否有显著差异,数据文件“ex28_cov。Rdata”.先不考虑数学入学成绩,只以“教学方法”为分组变量,“后测成绩”为因变量进行单因素方差分析:setwd(E:/办公资料/R语言/R语言学习系列/codes)load(”ex28_cov.Rdata”)head(scores) before after teach1 39 68 12 38
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 语言 学习 系列 28 协方差分析
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【a199****6536】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【a199****6536】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。