医学统计学(一元相关与回归).ppt
《医学统计学(一元相关与回归).ppt》由会员分享,可在线阅读,更多相关《医学统计学(一元相关与回归).ppt(57页珍藏版)》请在咨信网上搜索。
*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,相关与回归,第九章,用于研究和解释变量之间,相互,关系的,掌握:,积差相关,等级相关,线性回归的概念,线性回归方程的计算,回归系数的假设检验,相关与回归的区别与联系,了解:,曲线拟合,教学目的和要求,重点讲解,积差相关,等级相关,线性回归的概念,回归系数的假设检验,相关与回归的区别与联系,介绍,曲线拟合,教学内容提要,一、,积差相关,1,、散点图,2,、,积差,相关系数,定量描述,X,与,Y,两变量间直线相关,方向,和相关,密切程度,的统计指标。,积差相关系数(参数检验法),r,等级相关系数(非参数检验法),Pearson,相关系数,简称相关系数,适用于,x,、,y,都服从正态分布(称为双变量正态分布)的资料。,积差相关系数的计算,r,没有单位,取值范围,:-1,r,1,L,xy,=XY-(,X)(,Y)/n,L,xx,=X,2,-(,X),2,/n,L,yy,=Y,2,-(,Y),2,/n,协方差,r,的特点,没有单位,-1,r,1,r,=-1,完全负相关,,-1,r,0,负相关,r,=1,完全正相关,,0,r,1,正相关,r,=0,零相关,散点图,【,例,9-1】,一个产科医师发现孕妇尿中,雌三醇含量,与产儿的,体重,有关。于是设想,通过测量待产妇尿中雌三醇含量,可以预测产儿体重,以便对低出生体重进行预防。因此收集了31例待产妇24小时的尿,测量其中的雌三醇含量,同时记录产儿的体重。问尿中雌三醇含量与产儿体重之间是否存在相关关系?是正相关还是负相关?,3,、积差相关分析,编号,(1),尿雌三醇,mg/24h(2,),产儿体重,kg(3),编号,(1),尿雌三醇,mg/24h(2),产儿体重,kg(3),1,7,2.5,17,17,3.2,2,9,2.5,18,25,3.2,3,9,2.5,19,27,3.4,4,12,2.7,20,15,3.4,5,14,2.7,21,15,3.4,6,16,2.7,22,15,3.5,7,16,2.4,23,16,3.5,8,14,3.0,24,19,3.4,9,16,3.0,25,18,3.5,10,16,3.1,26,17,3.6,11,17,3.0,27,18,3.7,12,19,3.1,28,20,3.8,13,21,3.0,29,22,4.0,14,24,2.8,30,25,3.9,15,15,3.2,31,24,4.3,16,16,3.2,待产妇尿雌三醇含量与产儿体重关系,12,1),绘制散点图,2),积差相关系数的计算,X=534,;,Y=99.2,;,X,2,=9876 Y,2,=324.8,;,XY=1750,;,3),相关系数的假设检验,上例中,r=0.61,,说明了,31,例样本中雌三醇含量与出生体重之间存在相关关系。但是,这,31,例只是,总体,中的,一个样本,,由此得到的相关系数会存在抽样误差。,=0,时,由于抽样误差,可能导致,r,0,。,对,r,进行假设检验,,判断,r,0,是由于抽样误差所致,,还是两个变量之间,确实存在相关关系,。,3),相关系数的假设检验,总体相关系数,=0,表示总体中两变量,x,和,y,无直线相关关系,a.,用,t,作检验统计量,b.,直接用,r,作检验统计量,r,的标准误为,s,r,根据,t,分布性质来检验样本相关系数,r,是否来自,0,的总体,:,t,r,(,r,-,),/,s,r,(,r,-0,),/,s,r,r,/=,r,用,r,和自由度,v,n,-2,,查,附表,18,,相关系数界值表,H,0,:,=0,H,1,:,0,=,n,-2=31-2=29,查附表,7,,,t,0.0005/2,28,=3.9351,,,t,0.0002/2,28,=4.2754,,,0.0002,P,0.0005,,拒绝,H,0,,接受,H,1,,认为待产妇,尿中雌三醇含量与产儿体重,之间,有正相关关系,。,第二节 直线回归,一、回归方程,二、回归系数,三、回归系数的假设检验,四、直线回归的应用,一个人的快乐,不是因为他拥有的多,而是因为他计较的少,休息,二、等级相关,(秩相关),不服从正态分布的资料;,总体分布类型不知的资料;,用等级或相对数表示的资料;,数据一端或两端有不确定值的资料,用等级相关(或称秩相关)分析(属非参数统计法)。,秩相关系数,Spearman,相关系数,(,r,s,),Kendall,相关系数,(,r,k,),用,等级相关系数,表示两个变量间直线关系,密切程度,和,方向,。,先分别将两个变量按原始数值由小到大编秩(遇相同观察值时取平均秩),计算每对观察值的秩之差,d,。,n,为对子数;,d,为配对秩次之差;,T,x,(,或,T,y,),(,t,j,3,t,j,)/12,;,t,j,为,x,(,或,y,),中第,j,个相同秩次的个数。,查,附表,19,确定,P,的大小。,1,),Spearman,相关系数(,r,s,),【,例,9-2】,12,名,27,岁急性白血病患儿的血小板数与出血症状资料见下表,分析两者之间有无直线关系:,H,0,:,0,,,H,1,:,0,r,sc,0.4222,查统计用,附表,19,,,r,0.05/2(12),0.587,,,P,0.05,不能以,0.05,水准拒绝,H,0,,不能认为,2,7,岁急性白血病患儿的血小板数与出血症状之间有直线相关关系。,2,),Kendall,相关系数,在,X,的秩从小到大排列后,计算配对的,Y,每个秩下面更大者的个数,合计值记为,S,,计算,r,K,并在相同秩次较多时校正:,其中,,n,为对子数,,U,x,或,U,y,(,t,j,2,t,j,)/2,,,t,j,为第,j,个相同秩次的个数。,查,附表,20,确定,P,的大小。,三、相关系数应用注意事项,有实际意义,在两个变量的变化范围内进行相关,不是因果关系,但可做为进一步考证有无因果关系的基础,四、直线相关的应用,一般说来,当,n100,,并对,r,进行假设检验,有统计学意义时:,r,0.7,,则表示两个变量,高度,相关;,0.4,r,0.7,时,则表示两个变量之间,中度,相关;,0.2,r,0.4,时,则两个变量,低度相关,。,待产妇尿中雌三醇含量和产儿体重之间成正相关。那么,如果我们知道了一位待产妇的尿雌三醇含量,能推断出产儿的体重吗?,或产儿的体重可能在什么范围内呢?,身高与体重之间也成正相关关系。那么,身高每增加1厘米,体重增加多少克呢?,上面的相关关系分析不能提供给我们需要的答案。这些要用,直线回归,的方法来解决。,某保险公司承保汽车,5,万量,平均每量保费收入为,1000,元,则该保险公司汽车承保总收入为,5000,万元。,承保总收入:,Y,承保汽车量数:,X,Y=1000X,X,与,Y,两个变量间完全表现为一种确定性关系,即,函数关系,。,第二节 一元回归,银行的,1,年期存款利息年息为,2.25%,,存入的本金用,X,表示,到期的本息用,Y,表示,则,Y=X+2.25%X,这里,Y,与,X,仍表现为一种线性函数关系。,另外一种情况:,两事物之间有着密切的联系,但密切的程度并没有达到由一个可以完全确定另一个的程度。例如:,生长发育阶段动物体重增量与食量,广告费支出与商品销售额,由于其它因素的干扰,许多双变量之间的关系并不是严格的函数关系,不能用函数方程反映,为了区别于两变量间的函数方程,我们称这种关系式为,一元回归方程,,这种关系为,一元回归,。,第二节 一元回归,一、直线回归分析,绘制散点图,求直线回归方程,绘制回归直线,回归系数的假设检验,用直线方程描述两个变量间的,数量依存关系,。,一般形式:,a:,截距,b,:回归系数(回归直线斜率),1.,直线回归方程的求法,b,0,x,y,;,b,0,x,y,b,:意义为,x,每变化一个单位,,y,变化的平均值,x,:自变量,要求容易测定、容易控制,:,y,的估计值,,y,称因变量,要求在不同的,x,的 时候其分布为正态分布,y,a,、,b,的计算(用最小二乘法原理估计,b,),n,:对子数(数据对),剩余误差,,,残差,:各实测值,y,至回归直线纵向距离。,剩余平方和或残差平方和最小,。,SS,e,(,y,-),2,SS,总,=,SS,R,+,SS,e,决定系数,(,determining coefficient,,R,2,),:,回归平方和在总平方和中所占的比例。,R,2,=,SS,回,/,SS,总,R,2,=(,n,-1),s,y,2,r,2,/,(,n,-1),s,y,2,=,r,2,R,2,是,评价回归强度,的一个重要指标。,0,R,2,1,,,1,,回归效果越好,强度。,临床研究中,,R,2,0.7,认为回归效果不错。,2.,回归方程拟合效果评价(决定系数),编号,(1),尿雌三醇,mg/24h(2),产儿体重,kg(3),编号,(1),尿雌三醇,mg/24h(2,),产儿体重,kg(3),1,7,2.5,17,17,3.2,2,9,2.5,18,25,3.2,3,9,2.5,19,27,3.4,4,12,2.7,20,15,3.4,5,14,2.7,21,15,3.4,6,16,2.7,22,15,3.5,7,16,2.4,23,16,3.5,8,14,3.0,24,19,3.4,9,16,3.0,25,18,3.5,10,16,3.1,26,17,3.6,11,17,3.0,27,18,3.7,12,19,3.1,28,20,3.8,13,21,3.0,29,22,4.0,14,24,2.8,30,25,3.9,15,15,3.2,31,24,4.3,16,16,3.2,尿雌三醇,x(mg/24h),(1),X,2,(2),产儿体重,Y(kg),(3),Y,2,(4),XY,(5),7,49,2.5,6.25,17.5,9,81,2.5,6.25,22.5,9,81,2.5,6.25,22.5,12,144,2.7,7.29,32.4,14,196,2.7,7.29,37.8,16,256,2.7,7.29,43.2,22,484,4.0,16.02,88.0,25,625,3.9,15.21,97.5,24,576,4.3,18.49,103.2,534,9876,99.2,324.18,1750.0,(1),绘制散点图,(2),求直线回归方程,(3),绘制回归直线,在自变量的变化范围内选两点做直线,(,0,,,a,)(,X,,,Y,),这两点可以用来核对图线绘制是否正确。,例题中得到的直线回归方程一定经过,(,0,,,2.15,)(,17.23,,,3.2,),两点。,直线回归方程从样本资料计算而得,有抽样误差。,需要,对样本的回归系数,b,进行假设检验,以判断,b,是否从回归系数为零的总体中抽得,。,总体的回归系数一般用,表示。,是否能说明雌三醇与产儿体重之间一定存在回归关系?,t,-,检验,H,0,:,=0,(直线回归方程不成立),H,1,:,0,(直线回归方程成立),进行,=0,的假设检验(即,与,间无直线回归关系),t,检验或,检验,相关系数的检验,代替,(4),回归系数的假设检验,=,n,-2,H,0,:,=0,H,1,:,0 =0.05,=31-2=29,查表,t,0.0005/2,28,=3.9351,,,P,0.0005,拒绝,H,0,,接受,H,1,,认为待产妇,尿中雌三醇含量与产儿体重,之间存在直线回归关系。,二、直线回归方程的应用,估计,:,描述两变量间的依存关系,通过回归系数的假设检验,若认为两变量之间存在直线回归关系,则可用直线回归来描述。,利用回归方程进行预测,把自变量代入回归方程,对应变量进行估计。例如,已知某待产妇的尿雌三醇浓度,估计产儿的体重范围。,利用回归方程进行统计控制,胰岛素与血糖,制定正常值范围,血细胞,血红蛋白等,三、曲线拟合,对呈曲线关系的资料,可用散点图分析曲线的类型,建立曲线回归方程。,常用曲线的类型:,对数:,a,b,ln,X,指数:,ln,a,bX,幂函数:,ln,a,b,ln,X,Logistic,:,四、相关与回归分析注意事项,1.,实际意义,进行相关回归分析要有实际意义,不可把毫无关系的两个事物或现象用来作相关回归分析。,2.,相关关系,相关关系不一定是因果关系,也可能是伴随关系,并不能证明事物间有内在联系。例如,同一父母生的兄弟,往往哥高弟也高,这主要与遗传因素及生活条件相关,而不能说哥高是弟高的原因。但,如果事物之间存在因果关系,则两者必然是相关的,。,3.,利用散点图,对于性质不明确的两组数据,可先做散点图,在图上看它们有无关系、关系的密切程度、是正相关还是负相关,然后再进行相关回归分析。,4.,变量范围,相关分析和回归方程仅适用于样本的原始数据范围之内,出了这个范围,我们不能得出两变量的相关关系和原来的回归关系。,资料要求,直线回归要求应变量,Y,是服从正态分布,的随机变量,,X,是可以精确测量和严格控制的变量,一般称为,I,型回归,;,直线相关要求,X,和,Y,服从双变量正态分布,,二者间若进行回归分析,则称为,II,型回归,。,参与相关分析的两个变量,无主次之分,,参与回归分析的两个变量则有,自变量和应变量,之分。,五、相关与回归的区别,应用,说明两变量间的,关联关系用相关分析,;,说明两者数量上的,依存关系则用回归分析,。,意义,b,表示,X,每改变一个单位,,Y,平均改变,b,个单位,;,r,说明具有线性关联的两个变量间关系的,密切程度和相关方向,。,r,的绝对值越大,散点图中的点越趋向于一条直线,表明两变量的关系越密切,相关程度越高。,b,的绝对值越大,回归直线越陡,说明当,X,变化一个单位时,,Y,的平均变化就越大。,五、相关与回归的区别,计算方法,取值范围,单位,r,无量纲;,b,有量纲。,五、相关与回归的区别,六、相关与回归的联系,关系:,能进行回归分析的变量之间存在相关关系。所以,对于两组新数据(两个变量)可先做散点图,求出它们的相关系数,对于确有相关关系的变量再进行回归分析,求出回归方程。,六、相关与回归的联系,相关系数,r,与回归系数,b,:,),r,与,b,的,符号一致,。,r,为正时,,b,也为正,表示两变量是正相关,是同向变化。,r,为负时,,b,也为负,表示两变量是负相关,是反向变化。,),r,与,b,的,假设检验结果一致,,可用,r,的显著检验代替,b,的显著性检验。,)已知,x,、,y,的标准差,s,x,、,s,y,时,积差相关系数,r,与回归系数,b,可以,相互推算,。,r,=,b s,x,/s,y,,,b,=,r s,y,/s,x,回归强度和相关强度可以互相解释,:,决定系数,r,2,【,习题,】,查,医宗金鉴,中治积聚处方,得下表资料,用建立回归方程方法得到,=1.967+0.735,x,具有统计学意义,,R,2,=0.9996,。拟合度达,99.96%,。可见,用回归方程描述名医治病用药的配伍规律准确有效。,- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学 统计学 一元 相关 回归
咨信网温馨提示:
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【精***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【精***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【精***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【精***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
关于本文