医学统计(课堂PPT).ppt
《医学统计(课堂PPT).ppt》由会员分享,可在线阅读,更多相关《医学统计(课堂PPT).ppt(183页珍藏版)》请在咨信网上搜索。
1、医学统计学医学统计学(1010)1数据挖掘分析数据挖掘分析 第二部分第二部分Logistic回回归 第一部分第一部分2Logistic回归第一部分3回归分析的分类回归分析的分类多个因变量多个因变量(y1,y2,yk)路径分析路径分析结构方程模型分析结构方程模型分析一个一个因变因变量量 y连续型因变量连续型因变量(y)-线性回归分析线性回归分析分类型因变量分类型因变量(y)-Logistic 回归分析回归分析时间序列因变量时间序列因变量(t)-时间序列分析时间序列分析生存时间因变量生存时间因变量(t)-生存风险回归分析生存风险回归分析4多重线性回归多重线性回归logisticlogistic回归
2、回归5logisticlogistic回归(回归(logistic regressionlogistic regression)是研究因)是研究因变量为二分类或多分类观察结果与影响因变量为二分类或多分类观察结果与影响因素(自变量)之间关系的一种多变量分析素(自变量)之间关系的一种多变量分析方法,属概率型非线性回归。方法,属概率型非线性回归。6logisticlogistic回归的分类:回归的分类:(1 1)二分类资料)二分类资料logisticlogistic回归:回归:因变量因变量为两分类变量为两分类变量的资料,可用非条件的资料,可用非条件logisticlogistic回归和条件回归和条件
3、logisticlogistic回归回归进行分析。非条件进行分析。非条件logisticlogistic回归多用于非配比病例回归多用于非配比病例-对对照研究或队列研究资料,条件照研究或队列研究资料,条件logisticlogistic回归多用于配回归多用于配对或配比资料。对或配比资料。(2 2)多分类资料)多分类资料logisticlogistic回归:回归:因变量因变量为多项分类的为多项分类的资料,可用多项分类资料,可用多项分类logisticlogistic回归模型或有序分类回归模型或有序分类logisticlogistic回归模型进行分析。回归模型进行分析。7队列研究队列研究(cohor
4、t study)(cohort study):也称前瞻性研究、随访研究等。是一种由因及果也称前瞻性研究、随访研究等。是一种由因及果的研究,在研究开始时,根据以往有无暴露经历,将研究人群分为暴露人的研究,在研究开始时,根据以往有无暴露经历,将研究人群分为暴露人群和非暴露人群,在一定时期内,随访观察和比较两组人群的发病率或死群和非暴露人群,在一定时期内,随访观察和比较两组人群的发病率或死亡率。如果两组人群发病率或死亡率差别有统计学意义,则认为暴露和疾亡率。如果两组人群发病率或死亡率差别有统计学意义,则认为暴露和疾病间存在联系。病间存在联系。队列研究验证的暴露因素在研究开始前已存在,研究者知队列研究
5、验证的暴露因素在研究开始前已存在,研究者知道每个研究对象的暴露情况。道每个研究对象的暴露情况。研究人群研究人群+-+-调查方向:追踪收集资料调查方向:追踪收集资料比较比较疾病疾病人数人数暴露暴露abcda/(a+b)c/(c+d)队列研究原理示意图队列研究原理示意图8RRRR(相对危险度(相对危险度relative riskrelative risk):表示暴露组与非暴露组):表示暴露组与非暴露组发病率发病率(或死亡率或死亡率)的比值。也称为危险比(的比值。也称为危险比(risk ratiorisk ratio)。)。反映了暴露与疾病发生的关联强度。反映了暴露与疾病发生的关联强度。RRRR表明
6、暴露组发病或死亡的危险是非暴露组的多少倍。表明暴露组发病或死亡的危险是非暴露组的多少倍。9病例对照研究病例对照研究(case-control studies)(case-control studies):一种由果及因的回顾性一种由果及因的回顾性研究,先按疾病状态确定调查对象,分为病例研究,先按疾病状态确定调查对象,分为病例(case)(case)和对照和对照(control)(control)两组,然后利用已有的记录、或采用询问、填写调查两组,然后利用已有的记录、或采用询问、填写调查表等方式,了解其发病前的暴露情况,并进行比较,推测疾病表等方式,了解其发病前的暴露情况,并进行比较,推测疾病与暴
7、露间的关系。与暴露间的关系。+-病例病例+-对照对照调查方向:收集回顾性资料调查方向:收集回顾性资料abcda/(a+b)c/(c+d)比较比较人数人数暴露暴露疾病疾病病例对照原理示意图病例对照原理示意图1011病例对照研究的类型病例对照研究的类型(一)病例与对照不匹配(一)病例与对照不匹配-非条件非条件logisticlogistic回归回归在设计所规定的病例和对照人群中,分别抽取一定量的研究对在设计所规定的病例和对照人群中,分别抽取一定量的研究对象,一般对照应等于或多于病例数,此外无其他任何限制。象,一般对照应等于或多于病例数,此外无其他任何限制。(二)病例与对照匹配(二)病例与对照匹配-
8、条件条件logisticlogistic回归回归匹配或称配比(匹配或称配比(matchingmatching),即要求对照在某些因素或特),即要求对照在某些因素或特征上与病例保持一致,目的是对两组比较时排除混杂因素的征上与病例保持一致,目的是对两组比较时排除混杂因素的干扰。匹配分为成组匹配和个体匹配。干扰。匹配分为成组匹配和个体匹配。12非条件非条件logisticlogistic回归回归应变量为二分类资料应变量为二分类资料p一个二分类自变量一个二分类自变量p两个(多个)二分类自变量两个(多个)二分类自变量p无序多分类自变量无序多分类自变量p有序多分类自变量有序多分类自变量p引入数值型自变量引
9、入数值型自变量应变量为有序多分类资料应变量为有序多分类资料应变量为无序多分类资料应变量为无序多分类资料13二分类资料的二分类资料的logisticlogistic回归回归二分类二分类 logistic logistic 回归对自变量没有特殊要求回归对自变量没有特殊要求,自变量可以是分类变量自变量可以是分类变量(包括二分类和多分包括二分类和多分类变量类变量)和数值变量。和数值变量。二分类资料的二分类资料的logisticlogistic回归通过回归通过SPSSSPSS统计软件统计软件的的二元二元LogisticLogistic过程实现统计分析。过程实现统计分析。14【例例1 1】某某医师为研究妇
10、女服避孕药与子代染医师为研究妇女服避孕药与子代染色体异常的关系,分别调查了子代染色体异色体异常的关系,分别调查了子代染色体异常和正常的同龄组儿童的母亲常和正常的同龄组儿童的母亲5454名和名和196196名,名,结果如表结果如表。试对此资料进行分析,能否提出试对此资料进行分析,能否提出子代染色体异常与其母在孕前子代染色体异常与其母在孕前6 6个月内服用避个月内服用避孕药有关?孕药有关?15SPSS软件操作软件操作第第1 1步:定义变量步:定义变量16第第2 2步:步:输入原输入原始数据始数据17第第3 3步:加权设置步:加权设置选择选择数据数据加权个案(加权个案(WW)将将f f移入移入频率变
11、量频率变量18第第4 4步:步:logisticlogistic回归分析(回归分析(1 1)选择选择分析分析 回归回归二元二元logisticlogistic19第第4 4步:步:logisticlogistic回归分析(回归分析(2 2)将将a a和和b b分别移入分别移入协变量协变量和和因变量因变量20自变量全部进入模型自变量全部进入模型向前逐步选择法向前逐步选择法向后逐步剔除法向后逐步剔除法条件:将变量剔除出模型的依条件:将变量剔除出模型的依据是条件参数估计的似然比统据是条件参数估计的似然比统计量的概率值。计量的概率值。LRLR:将变量剔除出模型的依据:将变量剔除出模型的依据是最大偏似然
12、估计的似然比统是最大偏似然估计的似然比统计量的概率值。计量的概率值。WaldWald:将变量剔除出模型的依:将变量剔除出模型的依据是据是WaldWald统计量的概率值。统计量的概率值。21第第4 4步:步:logisticlogistic回归分析(回归分析(3 3)设置设置选项选项勾上勾上expexp(B B)的的95CI95CI。22第第4 4步:步:logisticlogistic回归分析(回归分析(4 4)结果解读:结果解读:OR=3.200OR=3.200,p=0.000p=0.000OROR的的95%CI95%CI为(为(1.7125.9831.7125.983)ExpExp(B B
13、)=e=eB B23值得注意的是病例值得注意的是病例-对照研究中对照研究中,病例与对病例与对照两组人数的比例是人为规定的照两组人数的比例是人为规定的,不代表不代表自然人群中真实的病人与正常人的比值。自然人群中真实的病人与正常人的比值。因此因此,根据病例一对照研究资料建立的根据病例一对照研究资料建立的 Logistic Logistic 回归方程中回归方程中,常数项意义不大常数项意义不大,主主要针对结果中自变量的回归系数及其相应要针对结果中自变量的回归系数及其相应的比数比的比数比OR OR 值的意义作解释值的意义作解释,不宜直接用不宜直接用于所研究事件发生概率的预测和判别于所研究事件发生概率的预
14、测和判别。24两个二分类自变量两个二分类自变量的的logisticlogistic回归回归两个自变量均为两水平的二分类资料的两个自变量均为两水平的二分类资料的 Logistic Logistic 回归分析与一个自变量为两水平的回归分析与一个自变量为两水平的二分类资料的二分类资料的 Logistic Logistic 回归分析在步骤方法回归分析在步骤方法上是相同的上是相同的,只是增加了一个自变量只是增加了一个自变量,在在建立建立 LogisticLogistic回归方程时需要对两个自变量回归方程时需要对两个自变量对应的参数进行估计对应的参数进行估计,计算两个比数比。计算两个比数比。另外另外,两个
15、自变量均有意义时两个自变量均有意义时,看哪个影看哪个影响作用更大些响作用更大些,与多重线性回归一样与多重线性回归一样,也也是比较标准偏回归系数绝对值的大小。是比较标准偏回归系数绝对值的大小。25无序多分类自变量的无序多分类自变量的Logistic Logistic 回归回归自变量是一个或多个为无序多分类变量时自变量是一个或多个为无序多分类变量时,其其 Logistic Logistic 回归在方法上同上述二分类资料的回归在方法上同上述二分类资料的 LogisticLogistic回归回归,只要对只要对自变量的不同水平构造哑变自变量的不同水平构造哑变量量即可。某一多分类无序自变量可构造的哑变量即
16、可。某一多分类无序自变量可构造的哑变量数等于该自变量的分类数减数等于该自变量的分类数减 1 1。将哑变量引入模型。将哑变量引入模型,其结果无论有无统计学意义其结果无论有无统计学意义,都是相对事先确定都是相对事先确定某一类为基准对照而言的。某一类为基准对照而言的。SPSSSPSS对字符型多分类无序自变量对字符型多分类无序自变量,系统默认以最系统默认以最后的那个分类为对照。后的那个分类为对照。26有序多分类自变量的有序多分类自变量的Logistic Logistic 回归回归Logistic Logistic 回归中自变量为有序多分类变量回归中自变量为有序多分类变量,即等级变量即等级变量,如文化程
17、度可分为文盲、小学、如文化程度可分为文盲、小学、中学、大学及以上等。中学、大学及以上等。这种资料的这种资料的 Logistic Logistic 回归分两种情况处理回归分两种情况处理:如果自变量的等级分组与如果自变量的等级分组与 logit(P)logit(P)呈线性关呈线性关系系,即等级效应等比例增加或减少即等级效应等比例增加或减少,则该自则该自变量可以变量可以作为一个数值型自变量引人模型作为一个数值型自变量引人模型;否则否则,将等级变量视为无序多分类自变量将等级变量视为无序多分类自变量,以哑变量的形式以哑变量的形式引入模型进行分析。引入模型进行分析。27引入数值型自变量的引入数值型自变量的
18、LogisticLogistic回归回归数值变量直接引入模型数值变量直接引入模型,得到相应的比数比得到相应的比数比 OR OR 是是指自变量增加一个单位指自变量增加一个单位(如年龄增加如年龄增加 1 1 岁岁)比数自然比数自然对数值的变化量。对数值的变化量。若将数值自变量分成几组若将数值自变量分成几组,如自变量年龄按如自变量年龄按 10 10 岁岁间隔分组引人模型时间隔分组引人模型时,其其OR OR 值是指年龄每增加值是指年龄每增加 10 10 岁比数自然对数值的变化量。岁比数自然对数值的变化量。28数值型变量转换成分类变量的临界点选择,数值型变量转换成分类变量的临界点选择,最佳的方法是采用最
19、佳的方法是采用ROCROC分析。分析。29【例例2 2】为了探索有关危险因素和保护因素,对为了探索有关危险因素和保护因素,对3232例胃癌病人和例胃癌病人和3232例对照者进行病例对照研究,例对照者进行病例对照研究,考察的危险因素作为自变量,分别为:考察的危险因素作为自变量,分别为:x1x1(年龄)(年龄)x2x2(蛋白质摄入量由低到高:(蛋白质摄入量由低到高:0 0,1 1,2 2,3 3,4 4)x3x3(新鲜蔬菜及水果食用情况:良好、一般、不足、严重不足(新鲜蔬菜及水果食用情况:良好、一般、不足、严重不足为为0 0,1 1,2 2,3 3),),x4x4(吃盐量高食物由轻到重为:(吃盐量
20、高食物由轻到重为:0 0,1 1,2 2,3 3,4 4),),x5x5(饮食习惯,从良好,一般,不良,严重不良为:(饮食习惯,从良好,一般,不良,严重不良为:0 0,1 1,2 2,3 3),),x6x6(精神心理因素,从乐观,较乐观,一般,不良为(精神心理因素,从乐观,较乐观,一般,不良为0 0,1 1,2 2,3 3)。Y Y(是否患胃癌作为因变量。(是否患胃癌作为因变量。0 0未患,未患,1 1患者)患者)30。31SPSS软件操作软件操作第第1 1步:定义变量步:定义变量32第第2 2步:输入步:输入原始数据原始数据33第第3 3步:步:logisticlogistic回归分析(回归
21、分析(1 1)选择选择分析分析 回归回归 二元二元logisticlogistic34第第3 3步:步:logisticlogistic回归分析(回归分析(2 2)将将x1-6x1-6和和y y分别移入分别移入协变量协变量和和因变量因变量35第第3 3步:步:logisticlogistic回归分析(回归分析(3 3)设置设置选项选项勾上勾上expexp(B B)的的95CI95CI。36第第3 3步:步:logisticlogistic回归分析(回归分析(4 4)结果解读:结果解读:给出各因素的给出各因素的OROR(95%CI95%CI)及)及相应的相应的p p值。值。37第第3 3步:步:
22、logisticlogistic回归分析(回归分析(5 5)38第第3 3步:步:logisticlogistic回归分析(回归分析(6 6)39第第3 3步:步:logisticlogistic回归分析(回归分析(7 7)结果解读:结果解读:给出入选各因素的给出入选各因素的OROR(95%CI95%CI)及相应的)及相应的p p值。值。40【例例3 3】为了探讨冠心病发生的有关危险因素,为了探讨冠心病发生的有关危险因素,对对2626例冠心病病人和例冠心病病人和2828例对照者进行病例例对照者进行病例-对照对照研究,各因素的说明及资料研究,各因素的说明及资料如下如下,试用,试用logistic
23、logistic回归分析方法筛选危险因素回归分析方法筛选危险因素 。41。42SPSS软件操作软件操作第第1 1步:定义变量步:定义变量43第第2 2步:输入原始数据步:输入原始数据44第第3 3步:步:logisticlogistic回归分析(回归分析(1 1)选择选择分析分析 回归回归 二元二元logisticlogistic45第第3 3步:步:logisticlogistic回归分析(回归分析(2 2)将将x1-8x1-8和和y y分别移入分别移入协变量协变量和和因变量因变量46第第3 3步:步:logisticlogistic回归分析(回归分析(3 3)设置设置选项选项勾上勾上exp
24、exp(B B)的的95CI95CI。47第第3 3步:步:logisticlogistic回归分析(回归分析(4 4)结果解读:结果解读:给出入选各因素的给出入选各因素的OROR(95%CI95%CI)及相应的)及相应的p p值。值。48多分类资料的logistic回归应变量为有序多分类资料的应变量为有序多分类资料的logisticlogistic回归回归u应变量的水平数大于应变量的水平数大于2 2,且水平之间存在等,且水平之间存在等级递增或递减关系的资料为有序多分类资级递增或递减关系的资料为有序多分类资料。料。uSPSSSPSS中通过有序中通过有序logisticlogistic过程实现。
25、过程实现。49【例例4 4】研究性别和两种治疗方法对某病疗效的研究性别和两种治疗方法对某病疗效的影响,疗效的评价分为三个有序等级,数据如影响,疗效的评价分为三个有序等级,数据如下,试做下,试做logisticlogistic回归分析:回归分析:50SPSS软件操作软件操作第第1 1步:定义变量步:定义变量51第第2 2步:步:输入原输入原始数据始数据52第第3 3步:加权设置步:加权设置选择选择数据数据加权个案(加权个案(WW)将将f f移入移入频率变量频率变量53第第4 4步:步:logisticlogistic回归分析(回归分析(1 1)选择选择分析分析 回归回归有序有序54第第4 4步:
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学 统计 课堂 PPT
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【丰****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【丰****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。