统计学各种检验.doc
《统计学各种检验.doc》由会员分享,可在线阅读,更多相关《统计学各种检验.doc(60页珍藏版)》请在咨信网上搜索。
1、(完整word)统计学各种检验u检验、t检验、F检验、X2检验 (转) 来源: 李冠炜的日志 常用显著性检验1。t检验适用于计量资料、正态分布、方差具有齐性的两组间小样本比较.包括配对资料间、样本与均数间、两样本均数间比较三种,三者的计算公式不能混淆.2。t检验应用条件与t检验大致相同,但t检验用于两组间方差不齐时,t检验的计算公式实际上是方差不齐时t检验的校正公式。3.U检验应用条件与t检验基本一致,只是当大样本时用U检验,而小样本时则用t检验,t检验可以代替U检验.4.方差分析用于正态分布、方差齐性的多组间计量比较。常见的有单因素分组的多样本均数比较及双因素分组的多个样本均数的比较,方差分
2、析首先是比较各组间总的差异,如总差异有显著性,再进行组间的两两比较,组间比较用q检验或LST检验等。5。X2检验是计数资料主要的显著性检验方法。用于两个或多个百分比(率)的比较。常见以下几种情况:四格表资料、配对资料、多于2行2列资料及组内分组X2检验.6。零反应检验用于计数资料.是当实验组或对照组中出现概率为0或100时,X2检验的一种特殊形式。属于直接概率计算法。7.符号检验、秩和检验和Ridit检验三者均属非参数统计方法,共同特点是简便、快捷、实用。可用于各种非正态分布的资料、未知分布资料及半定量资料的分析。其主要缺点是容易丢失数据中包含的信息。所以凡是正态分布或可通过数据转换成正态分布
3、者尽量不用这些方法。8。Hotelling检验用于计量资料、正态分布、两组间多项指标的综合差异显著性检验.计量经济学检验方法讨论计量经济学中的检验方法多种多样,而且在不同的假设前提之下,使用的检验统计量不同,在这里我论述几种比较常见的方法.在 讨论不同的检验之前,我们必须知道为什么要检验,到底检验什么?如果这个问题都不知道,那么我觉得我们很荒谬或者说是很模式化.检验的含义是要确实因果关 系,计量经济学的核心是要说因果关系是怎么样的。那么如果两个东西之间没有什么因果联系,那么我们寻找的原因就不对。那么这样的结果是没有什么意义的,或 者说是意义不大的。那么检验对于我们确认结果非常的重要,也是评价我
4、们的结果是否拥有价值的关键因素。所以要做统计检验.t 检验,t检验主要是检验单个ols估计值或者说是参数估计值的显著性,什么是显著性?也就是给定一个容忍程度,一个我们可以犯错误的限度,错误分为两 类:1、本来是错的但是我们认为是对的。2、本来是对的我们认为是错的.统计的检验主要是针对第一种错误而言的.一般的计量经济学中的这个容忍程度是 5,也就是说可以容忍我们范第一类错误的概率是5%。这样说不准确,但是比较好理解。t-stastic是类似标准正态化的正态分布两一样,也就是估计 值减去假设值除以估计值得标准差,一般假设值是0,这一点不难理解,如果是0 ,那么也就意味着没有因果关系。这个tstat
5、ic在经典假设之下服从t分布.t分布一般是和正态分布差不多,尤其是当样本的量足够大的时候,一般的经 验认为在样本数量大于120的时候,就可以看成是正态分布的.Fstatistc:F检验是属于联合检验比较重要的一种,主要的目的是用于对于一系列的原因的是否会产生结果这样一个命题做出的检验。F统计量主要的产生来源是SSRSSTSSE三个量。但是这个检验有一个缺点是必须在经典假设之下才能有效.LM 检验:这个检验的性质和F检验的性质是一样的,都是检验联合显著性的,不同的是F统计量符合F分布,但是LM统计量服从卡方分布。卡方分布是正态分布的变 量的平方和,而F分布是卡方分布的商,并且分子和分布必须独立,
6、这就是为什么F检验适用范围受限的原因。LM=n*SSR、或者是LM=n-SSR。至于其他的White检验、Brusch-pagan检验(异方差的检验方法)、还有序列相关的t检验、DW检验基本原来是相同的.关于异方差检验、序列相关的检验其中存在不同的地方,但是思想基本是相同的。关于异方差检验的讨论:1、Brusch-pagan检验:这个检验的思路比较简单,主要是要研究残查和X之间的关系,给定这样的一个方程:u=b0+b1*x1+bnxn+u的回归,其中进行F检验和LM检验。如果检验通过那么不存在异方差,如果不通过那么存在异方差。2、 White检验:这个检验也是对异方差的检验,但是这个检验不同的
7、是不仅对于X的一次方进行回归,而且考虑到残查和x的平方还有Xi*Xj之间的关系.给 定如下方程:u=b0+b1*y+b2y2+u。也是用F和LM联合检验来检验显著性。如果通过那么不存在异方差,否则存在。序列相关的检验方法的讨论:对 于时间序列的问需要知道一个东西,也就是一介自回归过程,也就是一般在教科书中说到的:AR(1)过程,其中的道理主要是说在当期的变量主要是取决于过去 一个时期的变量和一个随机误差项。表示如下:Ut=p*U(t-1)+et.在这里我要说到几个概念问题,I(1)(一阶积整)、I(0)(零阶积整)。 其中的一介自回归过程AR(1)就属于零阶积整过程,而一阶积整过程实际上是随机
8、游动和飘移的随机游动过程。随机游动过程:Ut=U(t1)+et.也 就是在AR(1)的过程之下,其中的P是等于1的。飘移的随机游动过程:Ut=a+U(t-1)+et。其中随机游动过程和AR(1)过程中的不同点在于 一个弱相依性的强弱问题,实际上我们在时间序列问题中,我们可以认为任何一个过程是弱相依的,但是问题的关键是我们不知道到底有多弱?或者更加直观地说, 我们想知道P到底是多大,如果P是0.9或者是一个比较接近于1得数,那么可能我们可以认为这个时间序列有高度持久性,这个概念表示当期的变量却绝于一个 很早的时期的变量,比如一阶积整过程,实际上et是一个独立统分布的变量,而且条件数学期望等于0,
9、没有异方差性.那么实际上这个序列的数学期望是和期数 没有什么关系的.那么也就意味着从第0期开始,U的数学期望值就是和很久以后的U的数学期望值一样的。但是方差就不同了,方差随着时间的增加不断扩大。我 们知道了,这种不同的概念就可以讨论在一阶自回归的条件之下的检验问题,但是我们说一介自回归的过程是参差序列的特征而已,其他的变量的特征问题我们不 谈。在讨论检验的问题以前,我有必要交待一下时间序列在ols估计的时候我们应该注意什么.实际上解决序列自相关问题最主要的问题就是一个差分的方法。因为如果是长期持久的序列或者是不是长期持久的序列,那么一定的差分就可以解除这种问题。1、 t检验。如果我们知道这个变
10、量是一个一介自回归的过程,如果我们知道自回归过程是AR(1)的。那么我们就可以这样作,首先我们做OLS估计,得到的参差 序列我们认为是一阶自相关的。那么为了验证这种情况,那么我们可以做Ut和U(t-1)的回归,当然这里可以包含一个截距项。那么我们验证其中的参数的估 计是不是显著的,就用t检验.t检验与F检验有什么区别1.检验有单样本t检验,配对t检验和两样本t检验.单样本t检验:是用样本均数代表的未知总体均数和已知总体均数进行比较,来观察此组样本与总体的差异性。配对t检验:是采用配对设计方法观察以下几种情形,1,两个同质受试对象分别接受两种不同的处理;2,同一受试对象接受两种不同的处理;3,同
11、一受试对象处理前后。F 检验又叫方差齐性检验.在两样本t检验中要用到F检验.从两研究总体中随机抽取样本,要对这两个样本进行比较的时候,首先要判断两总体方差是否相同,即方 差齐性。若两总体方差相等,则直接用t检验,若不等,可采用t检验或变量变换或秩和检验等方法.其中要判断两总体方差是否相等,就可以用F检验。2.t检验和方差分析的前提条件及应用误区用于比较均值的t检验可以分成三类,第一类是针对单组设计定量资料的;第二类是针对配对设计定量资料的;第三类则是针对成组设计定量资料的。后两种设计类型的区别在于事先是否将两组研究对象按照某一个或几个方面的特征相似配成对子。无论哪种类型的t检验,都必须在满足特
12、定的前提条件下应用才是合理的。若是单组设计,必须给出一个标准值或总体均值,同时,提供一组定量的观测结果,应用t检验的前提条件就是该组资料必须服从正态分布;若是配对设计,每对数据的差值必须服从正态分布;若是成组设计,个体之间相互独立,两组资料均取自正态分布的总体,并满足方差齐性。之所以需要这些前提条件,是因为必须在这样的前提下所计算出的t统计量才服从t分布,而t检验正是以t分布作为其理论依据的检验方法。值得注意的是,方差分析与成组设计t检验的前提条件是相同的,即正态性和方差齐性.t 检验是目前医学研究中使用频率最高,医学论文中最常见到的处理定量资料的假设检验方法.t检验得到如此广泛的应用,究其原
13、因,不外乎以下几点:现有的医学 期刊多在统计学方面作出了要求,研究结论需要统计学支持;传统的医学统计教学都把t检验作为假设检验的入门方法进行介绍,使之成为广大医学研究人员最熟悉 的方法;t检验方法简单,其结果便于解释。简单、熟悉加上外界的要求,促成了t检验的流行。但是,由于某些人对该方法理解得不全面,导致在应用过程中出现 不少问题,有些甚至是非常严重的错误,直接影响到结论的可靠性。将这些问题归类,可大致概括为以下两种情况:不考虑t检验的应用前提,对两组的比较一律用t检验;将各种实验设计类型一律视为多个单因素两水平设计,多次用t检验进行均值之间的两两比较。以上两种情况,均不同程度地增加了得出错误
14、结论的风险。而且,在实验因素的个数大于等于2时,无法研究实验因素之间的交互作用的大小。u检验和t检验区别与联系u 检验和t检验可用于样本均数与总体均数的比较以及两样本均数的比较。理论上要求样本来自正态分布总体。但在实用时,只要样本例数n较大,或n小但总体标准 差已知时,就可应用u检验;n小且总体标准差未知时,可应用t检验,但要求样本来自正态分布总体.两样本均数比较时还要求两总体方差相等。一、样本均数与总体均数比较比较的目的是推断样本所代表的未知总体均数与已知总体均数0有无差别。通常把理论值、标准值或经大量调查所得的稳定值作为0.根据样本例数n大小和总体标准差是否已知选用u检验或t 检验。(一)
15、u检验用于已知或未知但n足够大用样本标准差s作为的估计值,代入式(19。6)时。以算得的统计量u,按表193所示关系作判断。表19-3 u值、P值与统计结论|t|值P值统计结论0.05双侧单侧1。961。6450。05不拒绝H0,差别无统计学意义0.05双侧单侧1。961.6450。05拒绝H0,接受H1,差别有统计学意义0。01双侧单侧2。582.330。01拒绝H0,接受H1,差别有高度统计学意义例19。3根据大量调查,已知健康成年男子脉搏均数为72次/分,标准差为6.0次/分。某医生在山区随机抽查25名健康成年男子,求得其脉搏均数为74。2次/分,能否据此认为山区成年男子的脉搏高于一般?
16、据题意,可把大量调查所得的均数72次/分与标准差6。0次/分看作为总体均数0和总体标准差,样本均数x为74.2次/分,样本例数n为25.H0: =0H1: 0=0.05(单侧检验)算得的统计量u=1.8331。645,P0。05,按=0.05检验水准拒绝H0,可认为该山区健康成年男子的脉搏高于一般。(二)t检验用于未知且n较小时。以算得的统计量t,按表19-4所示关系作判断。表19-4 t值、P值与统计结论t值P值统计结论0。05t0。05(v)0.05不拒绝H0,差别无统计学意义0.05t0。05(v)0。05拒绝H0,接受H1,差别有统计学意义0.01t0.01(v)0。01拒绝H0,接受
17、H1,差别有高度统计学意义例19。4 若例19.3中总体标准差未知,但样本标准差已求出,s=6。5次/分,余数据同例19.3.据题意,与例19.3不同之处在于未知,可用t检验.H0: =0H1: 0=0。05(单侧检验)本例自由度v=251=24,查t界值表(单侧)(附表191)得t0。05(24)=1.711.算得的统计量t=1.6921.711,P0.05,按=0.05检验水准不拒绝H0,尚不能认为该山区成年男子的脉搏高于一般.二、配对资料的比较在 医学研究中,常用配对设计.配对设计主要有四种情况:同一受试对象处理前后的数据;同一受试对象两个部位的数据;同一样品用两种方法(仪器等)检验 的
18、结果;配对的两个受试对象分别接受两种处理后的数据。情况的目的是推断其处理有无作用;情况、的目的是推断两种处理(方法等)的结果有无差 别。公式(19。8)式中,0为差数年总体均数,因为假设处理前后或两法无差别,则其差数的均数应为0,d为一组成对数据之差d(简称差数)的均数,其计算公式同式(18。1);Sd为差数均数的标准误,sd为差数年的标准差,计算公式同式(18.3);n为对子数。因计算的统计量是t,按表19-4所示关系作判断。例19.5 应用某药治疗9例高血压病人,治疗前后舒张压如表195,试问用药前后舒张压有无变化?表19-5 高血压病人用某药治疗前后的舒张压(kPa)病人编号治疗前治疗后
19、差数dD2112。811。71。01.21213。113。10。00。00314。914。40.50.25414。413。60。80.64513.613。10。50。25613。113.3-0.20。04713。312。80.50。25814。113.60。50.25913。312.31.01.00合计4。73.89H0:该药治疗前后的舒张压无变化,即d=0H1:该药治疗前后的舒张压有变化,即d0=0.05自由度v=n1=8,查t界值表得t0.05(8)=2。306,t0。01(8)=3。355,本例t=3。714t0。01(8),P0。01,按=0。05检验水准拒绝H0,接受H1,可认为治疗
20、前后舒张压有变化,即该药有降压作用.三、完全随机设计的两样本均数的比较亦称成组比较。目的是推断两样本各自代表的总体均数1与2是否相等.根据样本含量n的大小,分u检验与t检验.(一)u检验可用于两样本含量n1、n2、均足够大时,如均大于50或100。公式(19.9)算得的统计量为u 值,按表19-3所示关系作出判断。例19.6某地抽样调查了部分健康成人红细胞数,其中男性360人,均数为4。6601012/L,标准差为0。5751012/L;女性255人,均数为4.1781012/L,标准差为0.2911012/L,试问该地男、女红细胞数的均数有无差别?H0: =0H1: 0=0.05今x1=4.
21、6601012/L,s1=0.5751012/L,n1=360;x2=4.1781012/L,s2=0。2911012/L,n2=255。算得的u=13。632。58,P0。01,按 =0.05检验水准拒绝H0,接受H1,可认为该地男女红细胞数的均数不同,男性高于女性.(二)t检验可用于两样本含量n1、n2较小时,且要求两总体方差相等,即方差齐(homoscedasticity)。若被检验的两样本方差相差较大且差别有统计学意义则需用t检验。公式(19.10)公式(19.11)公式(19.12)式中sx1x2,为两样本均数之差的标准误,s2c为合并估计方差(combined estimate v
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 各种 检验
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【精***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【精***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。