方差分析原理复习课程.doc
《方差分析原理复习课程.doc》由会员分享,可在线阅读,更多相关《方差分析原理复习课程.doc(26页珍藏版)》请在咨信网上搜索。
1、方差分析原理精品资料第六章 方差分析第一节 方差分析的基本原理上章介绍了1个或两个样本平均数的假设测验方法。本章将介绍k(k3)个样本平均数的假设测验方法,即方差分析(analysis of variance)。方差分析就是将总变异剖分为各个变异来源的相应部分,从而发现各变异原因在总变异中相对重要程度的一种统计分析方法。其中,扣除了各种试验原因所引起的变异后的剩余变异提供了试验误差的无偏估计,作为假设测验的依据。因而,方差分析象上章的t测验一样也是通过将试验处理的表面效应与其误差的比较来进行统计推断的,只不过这里采用均方来度量试验处理产生的变异和误差引起的变异而已。方差分析是科学的试验设计和分
2、析中的一个十分重要的工具。本章将在介绍方差分析基本原理和方法的基础上进一步介绍数学模型和基本假定。一、自由度和平方和的分解方差是平方和除以自由度的商。要将一个试验资料的总变异分解为各个变异来源的相应变异,首先必须将总自由度和总平方和分解为各个变异来源的相应部分。因此,自由度和平方和的分解是方差分析的第一步。下面先从简单的类型说起。设有k组数据,每组皆具n个观察值,则该资料共有nk个观察值,其数据分组如表6.1。表6.1 每组具n个观察值的k组数据的符号表组别观察值(,i=1,2,k;j=1,2,n)总和平均均方12ik在表6.1中,总变异是nk个观察值的变异,故其自由度,而其平方和则为: (6
3、1)(61)中的C称为矫正数: (62)这里,可通过总变异的恒等变换来阐明总变异的构成。对于第i组的变异,有 总变异为第1,2,k组的变异相加,利用上式总变异(61)可以剖分为: (63)即 总平方和=组内(误差)平方和+处理平方和组间变异由k个的变异引起,故其自由度,组间平方和为: (64) 组内变异为各组内观察值与组平均数的变异,故每组具有自由度和平方和;而资料共有组,故组内自由度,组内平方和为: (65)因此,得到表6.1类型资料的自由度分解式为: (66) 总自由度DFT=组间自由度DFt+组内自由度DFe求得各变异来源的自由度和平方和后,进而可得: (67) 若假定组间平均数差异不显
4、著(或处理无效)时,(67)中与是的两个独立估值,均方用表示,也用表示,两者可以互换。其中组内均方也称误差均方,它是由多个总体或处理所提供的组内变异(或误差)的平均值。 例6.1 以A、B、C、D 4种药剂处理水稻种子,其中A为对照,每处理各得4个苗高观察值(cm),其结果如表6.2,试分解其自由度和平方和。表6.2 水稻不同药剂处理的苗高(cm)药 剂苗高观察值总和平均A18 21 20 137218B20 24 26 229223C10 15 17 145614D28 27 29 3211629T=33621根据(66)进行总自由度的剖分: 总变异自由度DFT=(nk-1)=(44)-1=
5、15 药剂间自由度DFt=(k-1)=4-1=3 药剂内自由度DFe=k(n-1)=4(4-1)=12根据(63)进行总平方和的剖分: 或 或 药剂A内: 药剂B内: 药剂C内: 药剂D内:所以 误差平方和也可直接计算。 进而可得均方: 以上药剂内均方系4种药剂内变异的合并均方值,它是表6.2资料的试验误差估计;药剂间均方,则是不同药剂对苗高效应的变异。二、F分布与F测验 在一个平均数为、方差为的正态总体中,随机抽取两个独立样本,分别求得其均方和,将和的比值定义为F: (68)此F值具有的自由度和的自由度。如果在给定的和下按上述方法从正态总体中进行一系列抽样,就可得到一系列的F值而作成一个F分
6、布。统计理论的研究证明,F分布乃具有平均数=1和取值区间为0,的一组曲线;而某一特定曲线的形状则仅决定于参数和。在=1或=2时,F分布曲线是严重倾斜成反向J型;当3时,曲线转为偏态(图6.1)。图6.1 F分布曲线(随和的不同而不同)F分布下一定区间的概率可从已制成的统计表查出。附表5系各种和下右尾概率=0.05和=0.01时的临界F值(一尾概率表)。如查附表5,=3,=12时,F0.05=3.49,F0.01=5.95,即表示如以=3(n1=4)、=12(n2=13)在一正态总体中进行连续抽样,则所得F值大于3.49的概率仅有5%,而大于5.95的仅有1%。附表5的数值设计是专供测验的总体方
7、差是否显著大于的总体方差而设计的(H0:对HA:)。这时,。若所得FF0.05或F0.01,则H0发生的概率小于等于0.05或0.01,应该在=0.05或=0.01水平上否定H0,接受HA;若所得FF0.05或FF0.01,则H0发生的概率大于0.05或0.01,应接受H0。在方差分析的体系中,F测验可用于检测某项变异因素的效应或方差是否真实存在。所以在计算F值时,总是将要测验的那一项变异因素的均方作分子,而以另一项变异(例如试验误差项)的均方作分母。这个问题与方差分析的模型和各项变异来源的期望均方有关,详情见后。在此测验中,如果作分子的均方小于作分母的均方,则F1;此时不必查F表即可确定P0
8、.05,应接受H0。F测验需具备:(1)变数y遵循正态分布N(,),(2)和彼此独立两个条件。当资料不符合这些条件时,需作适当转换,参见本章第六节。例6.2 测定东方红3号小麦的蛋白质含量10次,得均方=1.621;测定农大139小麦的蛋白质含量5次,得均方=0.135。试测验东方红3号小麦蛋白质含量的变异是否比农大139为大。假设H0:东方红小麦总体蛋白质含量的变异和农大139一样,即H0:=,对HA:。显著水平取=0.05,=9,=4时,F0.05=6.00。测验计算: 此FF0.05,即P0.05。推断:否定H0,接受HA,即东方红3号小麦蛋白质含量的变异大于农大139。以上这种比较两个
9、事物变异大小的例子,在农业研究中是常常遇到的。例如比较杂种F2代和F1代的变异大小,比较两种处理的草坪冻害程度等等,这些比较皆可应用F测验,但都必须以大均方作分子而计算F值。例6.3 在例6.1算得药剂间均方=168.00,药剂内均方=8.17,具自由度=3,=12。试测验药剂间变异是否显著大于药剂内变异?假设H0:=对HA:,显著水平取=0.05,F0.05=3.49。测验计算: 计算得F=20.56表示处理项的均方为误差项均方的20.56倍。查附表5 =3,=12时F0.05=3.49,F0.01=5.95,实得FF0.01F0.05。 推断:否定H0:=,接受HA:;即药剂间变异显著地大
10、于药剂内变异,不同药剂对水稻苗高是具有不同效应的。以上通过例6.1说明了对一组处理的重复试验数据经对总平方和与总自由度的分解估计出处理间均方和处理内均方(误差均方),并通过测验处理间所表示出的差异是否真实(比误差大),这一方法即为方差分析法。这里所测验的统计假设是H0:=或对HA:或、和间存在差异(不一定、和间均不等,可能部分不等)。例6.1和例6.3的分析结果可以归纳在一起,列出方差分析表,如表6.3所示。表6.3 水稻药剂处理苗高方差分析表变异来源DFSSMSF显著F值药剂处理间 3504168.0020.563.49药剂处理内(误差)12 98 8.175.95总15602第二节 多重比
11、较上节对一组试验数据通过平方和与自由度的分解,将所估计的处理均方与误差均方作比较,由F测验推论处理间有显著差异,对有些试验来说方差分析已算告一段落,但对有些试验来说,其目的不仅在于了解一组处理间总体上有无实质性差异,更在于了解哪些处理间存在真实差异,故需进一步做处理平均数间的比较。一个试验中k个处理平均数间可能有k(k-1)/2个比较,因而这种比较是复式比较亦称为多重比较(multiple comparisons)。通过方差分析后进行平均数间的多重比较,不同于处理间两两单独比较。因为(1)误差由多个处理内的变异合并估计,自由度增大了,因而比较的精确度也增大了;(2)由于F测验显著,证实处理间总
12、体上有真实差异后再做两两平均数的比较,不大会像单独比较时那样将个别偶然性的差异误判为真实差异。这种在F测验基础上再做的平均数间多重比较称为Fisher氏保护下的多重比较(Fishers protected multiple comparisons)。显然在无F测验保护时,4个处理做两两比较,每一比较的显著水平,4个处理间有6个比较,若处理间总体上无差异,每一比较误判为有差异的概率为0.05,则6个比较中至少有1个被误判的概率为=。若处理数k=10,则=,因而尽管单个比较的显著水平为0.05,但从试验总体上(至少有1个误判的概率)是很大的,这说明通过F测验作保护是非常必要的。多重比较有多种方法,
13、本节将介绍常用的三种:最小显著差数法、复极差法( q法)和Duncan氏新复极差法。一、最小显著差数法最小显著差数法(least significant difference,简称LSD法),LSD法实质上是第五章的t测验。其程序是:在处理间的F测验为显著的前提下,计算出显著水平为的最小显著差数;任何两个平均数的差数(),如其绝对值,即为在水平上差异显著;反之,则为在水平上差异不显著。这种方法又称为F测验保护下的最小显著差数法(Fishers Protected LSD,或FPLSD)。已知: 若|t|,即为在水平上显著。因此,最小显著差数为: (69)当两样本的容量n相等时,在方差分析中,上
14、式的有了更精确的数值MSe(因为此自由度增大),因此(69)中的为: (610) 例6.4 试以LSD法测验表6.2资料各种药剂处理的苗高平均数间的差异显著性。由(例6.3)计算得F=20.56为显著,MSe=8.17,DFe=12,故 由附表4,12时,t0.05=2.179,t0.01=3.055故 LSD0.05=2.1792.02=4.40(cm);LSD0.01=3.0552.02=6.17(cm)然后将各种药剂处理的苗高与对照苗高相比,差数大于4.40cm为差异显著;大于6.17cm为差异极显著。由表6.2可知:药剂D与A、D与C、以及B与C处理平均数差数分别为11、15和9,大于
15、6.17,说明在0.01水平上差异显著;药剂D与B、B与A处理平均数差数分别为6和5,大于4.40,说明在0.05水平上差异显著;药剂A与C处理平均数差数为4,小于4.40,差异不显著。二、q法LSD 法的 t 测验是根据两个样本平均数差数( k=2 )的抽样分布提出的,但是一组处理(k2)是同时抽取k个样本的结果。抽样理论指出k=2时与k2,例如k=10时其随机极差是不同的,随着k的增大而增大,因而用k=2时的t测验有可能夸大了k=10时最大与最小两个样本平均数差数的显著性。基于极差的抽样分布理论Student-Newman-Keul提出了q测验或称复极差测验,有时又称SNK测验或NK测验。
16、q测验方法是将一组k个平均数由大到小排列后,根据所比较的两个处理平均数的差数是几个平均数间的极差分别确定最小显著极差值的。q测验因是根据极差抽样分布原理的,其各个比较都可保证同一个显著水平。其尺度值构成为: (611) (612)式中2pk,p是所有比较的平均数按大到小顺序排列所计算出的两极差范围内所包含的平均数个数(称为秩次距),SE为平均数的标准误,可见在每一显著水平下该法有k-1个尺度值。平均数比较时,尺度值随秩次距的不同而异。例6.5 试对表6.2资料的各平均数作q测验。 由6.1资料得: 查附表7 q值表,当DF=12时,p=2,3,4的值,并由(611)计算出尺度值,列于表6.4。
17、表6.4 表6.2资料值的计算(q测验)p23.084.324.406.1833.775.045.397.2144.205.506.017.87由表6.2可知,=29cm,=23cm,=18cm,=14cm。由此可得到:当p=2时,-=6(cm)5水平上显著;-=5(cm)5水平上显著;-=4(cm)不显著。当p=3时,-=11(cm)1水平上显著;-=9(cm)1水平上显著。当p=4时,-=15(cm)1水平上显著。三、新复极差法从表6.4可以发现,不同秩次距p下的最小显著极差变幅比较大,为此,D.B. Duncan(1955)提出了新复极差法,又称最短显著极差法(shortest sign
18、ificant ranges,SSR)。该法与q法相似,其区别在于计算最小显著极差时不是查q表而是查SSR表,所得最小显著极差值随着k增大通常比q测验时的减小。查得后,有 (613)此时,在不同秩次距p下,平均数间比较的显著水平按两两比较是,但按p个秩次距则为保护水平。例6.6 试对表6.2资料的各平均数作新复极差测验。已知=29cm,=23cm,=18cm,=14cm,MSe=8.17,查附表8,得值,由(613)算得在p=2,3,4时的值(表6.5),即为测验不同p时的平均数间极差显著性的尺度值。表6.5 表6.2资料LSR值的计算(新复极差测验)p23.084.324.406.1833.
19、234.554.626.5143.334.684.766.69当p=2时,-=6(cm)5水平显著;-=5(cm)5水平显著;-=4(cm)不显著。当p=3时,-=11(cm)1水平上显著;-=9(cm)1水平上显著。当p=4时,-=15(cm)1水平上显著。结论:表6.2资料的4个处理的苗高,除处理A与C差异不显著外,其余处理间均达显著差异,本例结果与上面介绍的q测验法相同,但q法的要比新复极差法的大。四、多重比较结果的表示方法各平均数经多重比较后,应以简洁明了的形式将结果表示出来。常用的表示方法有:(一) 列梯形表法将全部平均数从大到小顺次排列,然后算出各平均数间的差数。凡达到=0.05水
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 方差分析 原理 复习 课程
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【人****来】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【人****来】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。