生存分析和COX回归.pptx
《生存分析和COX回归.pptx》由会员分享,可在线阅读,更多相关《生存分析和COX回归.pptx(42页珍藏版)》请在咨信网上搜索。
1、第一节第一节 基本概念基本概念 在医学,生物学研究中,常用到生存分析(Survival Analysis)方法。例如对于肿瘤等疾病的疗效及预后的考核,通常不用治愈率,有效率等表示,而用将来复发或死亡的时间长短表示,也即生存期来表示。所谓生存期(survival time)是指从某个标准时刻(如发病,确诊,开始治疗或进行手术的时间)算起至死亡或复发为止的时间。生存期不同于一般指标的二个特点:1.有截尾数据(censored data)随访中未能知道病人的确切生存时间,只知道病人的生存时间大于某时间。(1)病人失访或因其他原因而死亡-失访(2)到了研究的终止期病人尚未死亡-终访截尾数据可记为t+,
2、如:4+=生存时间大于4年。虽然截尾数据提供的信息是不完全的,但不能删去,因为这不仅损失了资料,而且会造成偏性。2.生存期的资料一般不服从正态分布。由于上述原因,常用的统计方法不适用,而要用特殊的统计方法。生存分析是指对于生存期这一指标进行分析的一系列特殊的统计方法。生存时间不一定专用于死与活的情况,生存时间(存活时间)可定义为从某种起始事件到达某终点事件所经历的时间跨度。例如急性白血病病人从治疗开始到复发为止之间的缓解期;冠心病病人在两次发作之间的时间间隔;已作输卵管结扎的妇女从施行输卵管吻合手术后至受孕的时间间隔;在流行病学研究中,从开始接触危险因素到发病所经历的时间等都可作为生存时间用作
3、生存分析。有时还收集一些有关因素(称为自变量或协变量),以分析这些协变量是否对生存时间有影响,影响的大小,是缩短或延长生存时间。这可以通过Cox回归进行分析,因此,Cox 回归可看成带有协变量的生存分析。包括:(1)开始观察日期,终止观察日期-生存时间(2)结局(最终的观察到的是死亡还是存活)死于该病-完全数据 存活或死于其他原因-截尾数据 每个生存期数据要用2个变量表示:观察到的生存时间和是否截尾(如:用1表示截尾,用0表示死亡;4+用4,1表示;4用4,0表示)。(3)协变量-各种影响生存期长短的因素。随访资料的记录:第二节 描述生存时间分布规律的函数一.生存率(Survival Rate
4、)又称为生存概率或生存函数,它表示一个病人的生存时间长于时间t的概率,用S(t)表示:s(t)=P(Tt)如5年生存率:s(5)=P(T5)以时间t为横坐标,S(t)为纵坐标所作的曲线称为生存率曲线,它是一条下降的曲线,下降的坡度越陡,表示生存率越低或生存时间越短,其斜率表示死亡速率。1.2 概率密度函数 (Probability Density Function)简称为密度函数,记为f(t),其定义为:f(t)=lim(一个病人在区间(t,t+t)内死亡概率/t)它表示死亡速率的大小。如以t为横坐,f(t)为纵坐标作出的曲线称为密度曲线,由曲线上可看出不同时间的死亡速率及死亡高峰时间。纵坐标
5、越大,其死亡速率越高,如曲线呈现单调下降,则死亡速率越来越小,如呈现峰值,则为死亡高峰。1.3 风险函数(Hazard Function)用h(t)表示,其定义为:h(t)=lim(在时间t生存的病人死于区间(t,t)的概率/t)由于计算h(t)时,用到了生存到时间t,这一条件,故上式极限式中分子部分是一个条件概率。可将h(t)称为生存到时间t的病人在时间t的瞬时死亡率或条件死亡速率或年龄别死亡速率。当用t作横坐标,h(t)为纵坐标所绘的曲线,如递增,则表示条件死亡速率随时间而增加,如平行于横轴,则表示没有随时间而加速(或减少)死亡的情况。风险函数的不同情况:常数,如:死于飞机失事。下降,如:
6、急性损伤。上升,如:持续接触危险因素。澡盆样,如:人的一生。生存分析目的:(1)估计生存函数。(2)比较各组的生存函数。(3)研究影响生存期长短的因素。第三节 生存率的估计方法 生存率S(t)的估计方法有参数法和非参数法。常用非参数法,非参数法主要有二个,即,乘积极限法与寿命表法,前者主要用于观察例数较少而未分组的生存资料,后者适用于观察例数较多而分组的资料,不同的分组寿命表法的计算结果亦会不同,当分组资料中每一个分组区间中最多只有 1个观察值时,寿命表法的计算结果与乘积极限法完全相同。参数法可求出一个方程表示生存函数S(t)和时间t的关系,画出的生存曲线是光滑的下降曲线。非参数法只能得到某几
7、个时间点上的生存函数,再用直线联起来,画出的生存曲线是呈梯型的。一.乘积极限法(Product-Limit Method)简称为积限法或PL法,它是由统计学家Kaplan和Meier于1958年首先提出的,因此又称为Kaplan-Meier法,是利用条件概率及概率的乘法原理计算生存率及其标准误的。设S(t)表示t年的生存率,s(ti/ti-1)表示活过ti-1年又活过 ti年的条件概率,例如s(1),s(2)分别表示一年,二年的生存率,而s(2/1)表示活过一年者,再活一年的条件概率,据概率的乘法定律有:S(2)=S(1)S(2/1),一般地有 S(ti)=S(ti-1)S(ti/ti-1)例
8、22.1 用某中药加化疗(中药组)和化疗(对照组)两种疗法治疗白血病后,随访记录各患者的生存时间,不带+号者表示已死亡,即完全数据,带+号者表示尚存活,即截尾数据,试作生存分析。时间单位为月。中药组 10,2+,12+,13,18,6+,19+,26,9+,8+,6+,43+,9,4,31,24对照组 2+,13,7+,11+,6,1,11,3,17,7资料中药组积限法计算生存率时间 状态 期初人数 死亡人数 条件生存率 累积生 di di/ni(ni-di)累积生存 ti si ni di (ni-di)/ni 存率S(ti)ni(ni-di)率标准误 =2 活 4 死 15 1 0.933
9、3 0.9333 0.004762 0.004762 0.0644 6 活 6 活 8 活 9 死 11 1 0.9090 0.8485 0.009091 0.013853 0.0999 9 活 10 死 9 1 0.8889 0.7542 0.013889 0.027742 0.1256 12 活 13 死 7 1 0.8571 0.6465 0.023810 0.051551 0.1468 18 死 6 1 0.8333 0.5387 0.033333 0.084885 0.1570 19 活 24 死 4 1 0.7500 0.4040 0.083333 0.168218 0.1657
10、26 死 3 1 0.6667 0.2694 0.166667 0.334885 0.1559 31 死 2 1 0.5000 0.1347 0.500000 0.834885 0.1231 43 活二.寿命表法(Life Table Method)适用于随访的病例数较多,将资料按生存期进行分组,在分组的基础上计算生存率,本法也能用于不分组的资料,此时计算结果与积限法相同。某医院1946年1月1日到1951年12月31日收治的126例胃癌病例,生存情况如表22.2,试用寿命表法估计生存率。表22.2 126例胃癌患者寿命表法估计生存率 时间(年)期初例数 死亡例数 失访例数 截尾例数 有效例数
11、 条件生存率 累积生存率 di di/ni(ni-di)累积生存 ti ni di ui wi ni S(ti/ti-1)S(ti)ni(ni-di)率标准误 =0-126 47 4 15 116.5 0.5966 0.5966 5.80510-3 5.80510-3 0.0455 1-60 5 6 11 51.5 0.9029 0.5386 2.08810-3 7.89310-3 0.0479 2-38 2 0 15 30.5 0.9344 0.5033 2.30110-3 0.0102 0.0508 3-21 2 2 7 16.5 0.8788 0.4423 8.35910-3 0.018
12、6 0.0602 4-10 0 0 6 7.0 1.0000 0.4423 0 0.0186 0.0602 5-4 0 0 4 2.0 1.0000 0.4423 0 0.0186 0.0602 寿命表法估计生存率步骤如下:1.将观察例数按时间段(年)0-,1-,2-,划分,分别计数期初例数,死亡,失访,截尾例数列入表22.2的1-5列。事实上,从第二个时间段开始,期初人数ni 系由下式算得:ni=ni-1-di-ui-wi 例如第二行,即时间段1-,有 n2=126-47-4-15=60 2.计算各时间段期初实际观察例数,(亦称有效例数)ni ni=ni-ui/2-wi/2 上式表明该时间段
13、期初例数中的失访,及截尾例数只计其半时,即得有效例数。如第一行,n1=126-4/2-15/2=116.5 3.分别用(22.5)(22.6)(22.7)式计算条件生存率S(ti/ti-1),累积生存率s(ti)及其标准误。计算结果已列于表22.2中,第7,8,11列,表中9,10二列系用于第11列的计算。例如时间段0-中 S(ti/ti-1)=(116.5-47)/116.5=0.5966 S(ti)=10.5966=0.5966 SE(S(ti)=0.59665.80510-3=0.0455 故一年生存率的估计为0.59660.0455 同样二年生存率的估计为0.53860.0479 由于
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生存 分析 COX 回归
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【丰****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【丰****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。