《医学生存分析》.ppt
《《医学生存分析》.ppt》由会员分享,可在线阅读,更多相关《《医学生存分析》.ppt(108页珍藏版)》请在咨信网上搜索。
生生 存存 分分 析析(Survival Analysis)王王 静静安徽医科大学流行病与卫生统计学系安徽医科大学流行病与卫生统计学系5/6/20241安徽医科大学流统系王静制作例例1:25名恶性肿瘤病人随机分成名恶性肿瘤病人随机分成A(12人)、人)、B(13人)两组,分别采用手术及保守治疗两种方人)两组,分别采用手术及保守治疗两种方案进行治疗,之后随访观察直到案进行治疗,之后随访观察直到25名病人均死亡,名病人均死亡,记录下他们的存活时间(单位:天)。见下表所记录下他们的存活时间(单位:天)。见下表所示。示。5/6/20242安徽医科大学流统系王静制作5/6/20243安徽医科大学流统系王静制作例例2:25名恶性肿瘤病人随机分成名恶性肿瘤病人随机分成A(12人)、人)、B(13人)两组,分别采用手术及保守治疗两种方人)两组,分别采用手术及保守治疗两种方案进行治疗,之后随访观察案进行治疗,之后随访观察10年,记录他们的存年,记录他们的存活、死亡情况。见下表所示。活、死亡情况。见下表所示。5/6/20244安徽医科大学流统系王静制作5/6/20245安徽医科大学流统系王静制作对于例对于例1 1,只比较两组的生存时间长短即可,采用,只比较两组的生存时间长短即可,采用两样本秩和检验。两样本秩和检验。对于例对于例2 2,若比较两组的存活率,可采用两样本卡,若比较两组的存活率,可采用两样本卡方检验;但只考虑了生存效果评价的其中一个方方检验;但只考虑了生存效果评价的其中一个方面。面。而评价生存效果,不仅要看是否出现了某种结局而评价生存效果,不仅要看是否出现了某种结局(如:有效、治愈、死亡等),还要考虑出现这(如:有效、治愈、死亡等),还要考虑出现这些结局所经历的时间长短。(举例说明)些结局所经历的时间长短。(举例说明)5/6/20246安徽医科大学流统系王静制作措施:采用措施:采用生存分析方法。生存分析方法。生存分析方法特点:生存分析方法特点:(1 1)能将研究对象的)能将研究对象的随访结局随访结局和和生存时间生存时间两个因素同时结两个因素同时结合起来考虑的一种统计方法;合起来考虑的一种统计方法;(2 2)能处理失访等不完全数据,充分利用所获得的信息,)能处理失访等不完全数据,充分利用所获得的信息,对生存时间的分布特征进行描述、比较,对影响生存时间对生存时间的分布特征进行描述、比较,对影响生存时间的主要因素进行分析,达到全面评价和比较随访资料的目的主要因素进行分析,达到全面评价和比较随访资料的目的。的。5/6/20247安徽医科大学流统系王静制作生存分析方法的用途:生存分析方法的用途:用于用于随访研究随访研究 (即:观察结果并非在短期内能够确定,(即:观察结果并非在短期内能够确定,而需做长期随访观察,如对一些慢性病或恶而需做长期随访观察,如对一些慢性病或恶性肿瘤的预后及远期疗效观察等)。性肿瘤的预后及远期疗效观察等)。5/6/20248安徽医科大学流统系王静制作随访研究的特点随访研究的特点医学随访研究:医学随访研究:1 1、队列研究、队列研究所有被观察对象同时进入研究;所有被观察对象同时进入研究;2 2、临床随访研究(一般称、临床随访研究(一般称“临床试验临床试验”)被观察对被观察对象逐个进入研究。象逐个进入研究。在大多数研究中,由于受经费和时间的限制,最终观察在大多数研究中,由于受经费和时间的限制,最终观察时点是固定的,而不是无限制延长的,所以容易产生时点是固定的,而不是无限制延长的,所以容易产生截尾值。截尾值。5/6/20249安徽医科大学流统系王静制作截尾值截尾值假设一组肺癌病人手术后,随访记录他们的存活情况,假设一组肺癌病人手术后,随访记录他们的存活情况,死于肺癌是终点。死于肺癌是终点。当观察到规定的时点,除了死于肺癌,还有:当观察到规定的时点,除了死于肺癌,还有:死于其他病、死于其他病、尚活着、尚活着、因迁移等原因失去联系(即失访)因迁移等原因失去联系(即失访),后三者的观察值都未达到终点,不能提供完全的信息,后三者的观察值都未达到终点,不能提供完全的信息,这种不完全数据称为截尾值(这种不完全数据称为截尾值(censoringcensoring)。)。5/6/202410安徽医科大学流统系王静制作 终点事件终点事件 失访失访 研究时间研究时间 观察起点观察起点 观察终点观察终点 队列研究队列研究中的截尾情况中的截尾情况5/6/202411安徽医科大学流统系王静制作 终点事件终点事件 失访失访 研究时间研究时间 观察起点观察起点 观察终点观察终点 临床随访研究临床随访研究中的截尾情况中的截尾情况5/6/202412安徽医科大学流统系王静制作基基 本本 概概 念念5/6/202413安徽医科大学流统系王静制作1 1、生存时间生存时间(survival timesurvival time)(狭义)从发病到死亡所经历的时间;狭义)从发病到死亡所经历的时间;(广义)从某种起始事件到某种终点事件所(广义)从某种起始事件到某种终点事件所经历的时间,又称失效时间经历的时间,又称失效时间(failure(failure time)time),表示为,表示为t t。5/6/202414安徽医科大学流统系王静制作“生存生存”和和“死亡死亡”扩展为具有两类互斥扩展为具有两类互斥结果的事件,结果的事件,“生存生存”是某事件某状态的是某事件某状态的持续,持续,“死亡死亡”是某终点事件的发生。是某终点事件的发生。“生存时间生存时间”扩展为某事件某状态所持续扩展为某事件某状态所持续的时间或过程的时间或过程。5/6/202415安徽医科大学流统系王静制作2 2、起点事件起点事件和和终点事件(终点事件(endpoint eventendpoint event)终点事件也称为观察结果(终点事件也称为观察结果(outcomeoutcome),是指研),是指研究者关心的研究对象的特定结局,当被观察对究者关心的研究对象的特定结局,当被观察对象出现终点事件通常记为象出现终点事件通常记为1 1,出现截尾记为,出现截尾记为0 0。起点事件是反映研究对象生存过程的起始特征的起点事件是反映研究对象生存过程的起始特征的事件。事件。生存时间的起点和终点要有严格、统一的定义,生存时间的起点和终点要有严格、统一的定义,以便于计算生存时间。以便于计算生存时间。5/6/202416安徽医科大学流统系王静制作3 3、暴露因素暴露因素及及混杂因素混杂因素除了要研究的危险因素(暴露因素)外,还要控除了要研究的危险因素(暴露因素)外,还要控制混杂因素的影响。制混杂因素的影响。必须分清暴露因素和混杂因素。必须分清暴露因素和混杂因素。如:在比较如:在比较A A、B B两种治疗方案治疗某恶性疾病的两种治疗方案治疗某恶性疾病的生存情况的同时,病人的肾功能状况也影响治生存情况的同时,病人的肾功能状况也影响治疗后的生存情况。这项研究中,暴露因素为疗后的生存情况。这项研究中,暴露因素为A A、B B两种治疗方案,混杂因素是肾功能状况。两种治疗方案,混杂因素是肾功能状况。5/6/202417安徽医科大学流统系王静制作随随 访访 资资 料料 的的 特特 点点1 1、生存时间的分布呈偏态。、生存时间的分布呈偏态。一般为正偏态,因为生存时间一般为单调递减。一般为正偏态,因为生存时间一般为单调递减。102102名黑色素瘤患者的生存时间资料,做直方图。名黑色素瘤患者的生存时间资料,做直方图。5/6/202418安徽医科大学流统系王静制作5/6/202419安徽医科大学流统系王静制作5/6/202420安徽医科大学流统系王静制作2 2、数据中常含有截尾值。、数据中常含有截尾值。如如4141+(天),表示该病人至少活了(天),表示该病人至少活了4141天;虽然不天;虽然不知道确切时间,但此类不完全数据包含一定信息,知道确切时间,但此类不完全数据包含一定信息,需要生存分析这特殊方法来利用这些信息。需要生存分析这特殊方法来利用这些信息。组别组别生存时间(天)生存时间(天)A A27 35 4127 35 41+B B99 8099 80+102 102 5/6/202421安徽医科大学流统系王静制作5/6/202422安徽医科大学流统系王静制作生存分析的主要内容生存分析的主要内容及研究方法及研究方法5/6/202423安徽医科大学流统系王静制作 主要内容主要内容 研究方法研究方法1 1、生存过程的描述、生存过程的描述 乘积乘积-极限法(极限法(K Kaplan-aplan-M Meiereier)寿命表法(寿命表法(L Life ife T Tablesables)2 2、生存过程的比较生存过程的比较 对数秩检验(对数秩检验(log-ranklog-rank)3 3、影响因素的分析影响因素的分析 CoxCox比例风险模型比例风险模型 5/6/202424安徽医科大学流统系王静制作生存分析对资料中应变量的要求:生存分析对资料中应变量的要求:5/6/202425安徽医科大学流统系王静制作1 1、达到终点的例数所占的比例不能太少,即完全、达到终点的例数所占的比例不能太少,即完全数据占大部分,截尾值所占的比例要数据占大部分,截尾值所占的比例要10%;2 2、截尾原因无偏性;、截尾原因无偏性;3 3、生存时间尽可能精确。、生存时间尽可能精确。5/6/202426安徽医科大学流统系王静制作常常 用用 的的 研研 究究 指指 标标5/6/202427安徽医科大学流统系王静制作1 1、生存函数生存函数(survival functionsurvival function)又称又称累积生存概率累积生存概率(cumulative survival cumulative survival probabilityprobability)、生存率生存率,表示个体生存,表示个体生存时间时间T Tt t的概率。的概率。5/6/202428安徽医科大学流统系王静制作生存概率生存概率与与生存率生存率生存概率生存概率:在:在单位时段单位时段开始存活的个体到该时段结束时仍开始存活的个体到该时段结束时仍存活的可能性,用存活的可能性,用p p表示;表示;生存率生存率:观察个体活过:观察个体活过t t个单位时间的概率,用个单位时间的概率,用S(tS(t)表示。表示。如数据中无截尾值,则生存率计算公式为:如数据中无截尾值,则生存率计算公式为:S(tS(t)=)=生存时间生存时间t t的病人数的病人数 /随访病人总数随访病人总数如有截尾值,则分时段计算不同单位时段的生存概率如有截尾值,则分时段计算不同单位时段的生存概率p p1 1、p p2 2、ppt t,S(tS(t)=p)=p1 1p p2 2p pt t,即,即累积生存概率累积生存概率。5/6/202429安徽医科大学流统系王静制作5/6/202430安徽医科大学流统系王静制作可采用可采用SPSSSPSS软件中生存分析方法计算出生存软件中生存分析方法计算出生存率大小,并画出生存函数图(或生存率曲率大小,并画出生存函数图(或生存率曲线)直接观察。线)直接观察。5/6/202431安徽医科大学流统系王静制作5/6/202432安徽医科大学流统系王静制作5/6/202433安徽医科大学流统系王静制作2 2、半数生存时间半数生存时间(median survival time)(median survival time)又称又称中位生存时间中位生存时间,表示累积生存概率(生存率),表示累积生存概率(生存率)为为50%50%的时候所对应的生存时间;为中位数指的时候所对应的生存时间;为中位数指标,因为生存时间的分布是偏态的。标,因为生存时间的分布是偏态的。在分析结果中给出中位生存时间在分析结果中给出中位生存时间;从生存曲线图中也能估计出相同结果。从生存曲线图中也能估计出相同结果。5/6/202434安徽医科大学流统系王静制作5/6/202435安徽医科大学流统系王静制作3 3、风险函数风险函数(hazard function)(hazard function)又称危险率函数等,一般用又称危险率函数等,一般用h(th(t)表示,表示生存表示,表示生存时间已达时间已达t t的个体在的个体在t t时刻的瞬时风险率;在时刻的瞬时风险率;在CoxCox比例风险模型中风险函数常用比例风险模型中风险函数常用(t)(t)表示。表示。h(t)=h(t)=死于区间(死于区间(t t,t+tt+t)的病人数的病人数 在在t t时刻尚存的病人数时刻尚存的病人数tt t t为极小时间段。为极小时间段。5/6/202436安徽医科大学流统系王静制作5/6/202437安徽医科大学流统系王静制作4 4、风险比风险比(hazard ratiohazard ratio)是指同一时点两组的风险函数之比,即是指同一时点两组的风险函数之比,即相对危险度相对危险度RRRR。风险比风险比=第一组个体的第一组个体的h h1 1(t)(t)第二组个体的第二组个体的h h2 2(t)(t)(1 1)比例风险:风险比与时间无关,即任何时刻,两组比例风险:风险比与时间无关,即任何时刻,两组的风险比值是相等的;的风险比值是相等的;(2 2)非比例风险或时间依赖型:风险比与时间有关。)非比例风险或时间依赖型:风险比与时间有关。5/6/202438安徽医科大学流统系王静制作乘积乘积极限法(极限法(Kaplan-MeierKaplan-Meier)寿命表法(寿命表法(Life tableLife table)AnalyzeSurvival Life tableAnalyzeSurvival Life table、Kaplan-MeierKaplan-Meier用途:用途:1 1、做出生存表、估计生存率,并绘出两组的生存曲、做出生存表、估计生存率,并绘出两组的生存曲线图和风险函数图;线图和风险函数图;2 2、进行两组生存资料的比较。、进行两组生存资料的比较。5/6/202439安徽医科大学流统系王静制作 Life table Kaplan-Meier共同点:共同点:非参数分析方法、一般用于单因素分析非参数分析方法、一般用于单因素分析适用条件适用条件 大样本资料大样本资料 大样本、小样本资料大样本、小样本资料生存表生存表 人为划分各时间段人为划分各时间段 每个时间值为一段每个时间值为一段多组间的生存率比较方法多组间的生存率比较方法 (方法选择途径)(方法选择途径)“Options”对话框对话框 “Compare Factors”对话对话框框5/6/202440安徽医科大学流统系王静制作见下例见下例wordword文档中的数据及对应的文档中的数据及对应的SPSSSPSS数据文件数据文件KM1.savKM1.sav,采用乘积极限法进行分析。,采用乘积极限法进行分析。注意:注意:1)SPSS数据文件格式;数据文件格式;2)SPSS中中乘积极限法的操作过程;乘积极限法的操作过程;3 3)乘积极限法的具体结果解释。)乘积极限法的具体结果解释。5/6/202441安徽医科大学流统系王静制作5/6/202442安徽医科大学流统系王静制作5/6/202443安徽医科大学流统系王静制作5/6/202444安徽医科大学流统系王静制作5/6/202445安徽医科大学流统系王静制作5/6/202446安徽医科大学流统系王静制作5/6/202447安徽医科大学流统系王静制作5/6/202448安徽医科大学流统系王静制作5/6/202449安徽医科大学流统系王静制作注意事项:注意事项:组间的生存率比较时,要求组间的生存率比较时,要求各组的生存曲线不各组的生存曲线不能交叉能交叉,若出现交叉,提示可能存在混杂因,若出现交叉,提示可能存在混杂因素,应采用多因素方法来校正混杂因素或分素,应采用多因素方法来校正混杂因素或分层做统计分析。层做统计分析。5/6/202450安徽医科大学流统系王静制作采用采用Life table法对某法对某生存数据生存数据进行分析进行分析5/6/202451安徽医科大学流统系王静制作5/6/202452安徽医科大学流统系王静制作5/6/202453安徽医科大学流统系王静制作生存分析中的生存分析中的多因素分析方法多因素分析方法5/6/202454安徽医科大学流统系王静制作5/6/202455安徽医科大学流统系王静制作5/6/202456安徽医科大学流统系王静制作(生存分析方法中单因素与多因素分析的区别)(生存分析方法中单因素与多因素分析的区别)若只比较男、女的生存情况优劣,则可采用前面若只比较男、女的生存情况优劣,则可采用前面所述的单因素分析方法所述的单因素分析方法乘积极限法、寿命乘积极限法、寿命表法。表法。而在实际工作中,研究者关心的影响因素不止一而在实际工作中,研究者关心的影响因素不止一个,如在此例中,除了性别,还有年龄等其他个,如在此例中,除了性别,还有年龄等其他因素。因此,应采用多因素分析方法。因素。因此,应采用多因素分析方法。5/6/202457安徽医科大学流统系王静制作(多元线性回归、多元(多元线性回归、多元logisticlogistic回归与生存分析中多因素回回归与生存分析中多因素回归分析方法的区别)归分析方法的区别)如果仅以生存时间为反应变量做多元线性回归,则生存时间如果仅以生存时间为反应变量做多元线性回归,则生存时间并不一定服从近似正态分布,不满足线性回归的要求;并不一定服从近似正态分布,不满足线性回归的要求;若仅以是否达到终点为反应变量做多元若仅以是否达到终点为反应变量做多元logisticlogistic回归,则未回归,则未能充分利用生存时间长短的信息。能充分利用生存时间长短的信息。而且两者均未考虑到资料中删失数据提供的信息。而且两者均未考虑到资料中删失数据提供的信息。5/6/202458安徽医科大学流统系王静制作解决措施:解决措施:采用生存分析中的多因素回归。采用生存分析中的多因素回归。生存分析中的多因素回归同时以生存时间、结局为生存分析中的多因素回归同时以生存时间、结局为反应变量,有效利用不完全数据提供的信息,从反应变量,有效利用不完全数据提供的信息,从而探索生存的影响因素。而探索生存的影响因素。5/6/202459安徽医科大学流统系王静制作生存分析中的多因素回归包括:生存分析中的多因素回归包括:半参数方法半参数方法:coxcox比例风险模型、非比例风险模型比例风险模型、非比例风险模型参数方法参数方法:指数分布模型、:指数分布模型、WeibullWeibull分布模型、分布模型、GompertzGompertz分布模型、对数正态分布模型、对数分布模型、对数正态分布模型、对数logisticlogistic分布模型,等。分布模型,等。参数方法中均假设生存时间服从某分布,而半参数参数方法中均假设生存时间服从某分布,而半参数方法中不需指定生存时间的分布情况。方法中不需指定生存时间的分布情况。5/6/202460安徽医科大学流统系王静制作Cox 比例风险模型比例风险模型5/6/202461安徽医科大学流统系王静制作适用情况:适用情况:用于分析带有伴随变量的生存时间资料,如:用于分析带有伴随变量的生存时间资料,如:肿瘤和其它慢性病的预后分析,临床疗效评价肿瘤和其它慢性病的预后分析,临床疗效评价和队列研究的病因探索。和队列研究的病因探索。优点:优点:适用条件宽,便于作适用条件宽,便于作多因素分析多因素分析。5/6/202462安徽医科大学流统系王静制作一、一、cox回归模型简介回归模型简介5/6/202463安徽医科大学流统系王静制作1、模、模 型型 结结 构构即即Cox回归,它的一般形式是:回归,它的一般形式是:(t)=0(t)e(1*x1+2*x2+.+m*xm)=0(t)exp(1*x1+2*x2+.+m*xm)5/6/202464安徽医科大学流统系王静制作(t t)表示表示t t时刻暴露于各危险因素(时刻暴露于各危险因素(x x1 1,x x2 2,.x xm m)状态下状态下的风险函数。的风险函数。0 0(t t)为基线风险函数,表示所有的危险因为基线风险函数,表示所有的危险因素状态都为素状态都为0 0情况下的风险函数。情况下的风险函数。(t)/0(t)=exp(1*x1+2*x2+.+m*xm)即:即:ln(t)/0(t)=1*x1+2*x2+.+m*xm将将cox回归与线性回归、回归与线性回归、logistic回归做一比较。回归做一比较。5/6/202465安徽医科大学流统系王静制作0 0(t t)的形式不限,使模型的适用范围如同非参的形式不限,使模型的适用范围如同非参数法那么广;模型中含有参数数法那么广;模型中含有参数,又使得其统,又使得其统计效率接近参数模型。(但参数计效率接近参数模型。(但参数就不能用传就不能用传统的方法进行估计和检验)统的方法进行估计和检验)模型中含有参数模型中含有参数 ,但基线风险函数但基线风险函数0 0(t t)不要求服从特定分布形式,具有非参数的特点不要求服从特定分布形式,具有非参数的特点,故故CoxCox回归又称为回归又称为半参数模型半参数模型。5/6/202466安徽医科大学流统系王静制作英国生物统计学家英国生物统计学家D.R.CoxD.R.Cox于于19721972年建立年建立了条件死亡概率和偏似然函数方法,了条件死亡概率和偏似然函数方法,解决了参数解决了参数的估计和检验问题。故,的估计和检验问题。故,该统计分析方法称为该统计分析方法称为CoxCox模型。模型。5/6/202467安徽医科大学流统系王静制作2 2、参数的统计学意义、参数的统计学意义假设只有一个假设只有一个X X危险因素,危险因素,0 0为为“不暴露不暴露”,1 1为为“暴露暴露”,模型形式为:,模型形式为:(t t)=)=0 0(t t)exp(exp(*x)*x)X=1X=1时的风险函数为:时的风险函数为:1 1(t t)=)=0 0(t t)exp(exp(*1)*1)X=0X=0时的风险函数为:时的风险函数为:2 2(t t)=)=0 0(t t)exp(exp(*0)*0)1 1(t)(t)、2 2(t)(t)分别表示暴露于危险因素的两种不分别表示暴露于危险因素的两种不同状态下发病的风险函数。同状态下发病的风险函数。5/6/202468安徽医科大学流统系王静制作暴露于危险因素的两种不同状态下发病的风险比即为暴露于危险因素的两种不同状态下发病的风险比即为相对相对危险度危险度RRRR。RRRR=1 1(t)/(t)/2 2(t)(t)=0 0(t t)exp(exp(*1)/*1)/0 0(t t)exp(exp(*0)*0)=exp(exp(*1)/*1)/exp(exp(*0)=exp*0)=exp()RRRR表示表示暴露组与非暴露组的风险函数之比,即:暴露组发暴露组与非暴露组的风险函数之比,即:暴露组发病的风险是非暴露组的病的风险是非暴露组的RRRR倍。倍。回归系数回归系数的流行病学含义是的流行病学含义是0 0、1 1协变量协变量X X的相对危险度的的相对危险度的自然对数自然对数。5/6/202469安徽医科大学流统系王静制作如果如果X X为连续性变量为连续性变量年龄(岁),则年龄(岁),则1 1(t)(t)、2 2(t)(t)分分别表示别表示k k岁、岁、k+1k+1岁的两种不同状态下发病的风险函数。岁的两种不同状态下发病的风险函数。RR RR=1 1(t)/(t)/2 2(t)(t)=0 0(t t)exp(*)exp(*(k+1k+1))/)/0 0(t t)exp(exp(*k)*k)=exp(exp(*(k+1k+1)/exp(exp(*k)=exp*k)=exp():X X每增加一个单位时其相对危险度的自然对数值。每增加一个单位时其相对危险度的自然对数值。RRRR表示表示某危险因素(或协变量)改变一个测量单位时风险函某危险因素(或协变量)改变一个测量单位时风险函数改变多少倍。数改变多少倍。5/6/202470安徽医科大学流统系王静制作当当0 0,说明相应协变量值的增加将增大所研究,说明相应协变量值的增加将增大所研究事件发生的可能性;事件发生的可能性;当当0 0,相应协变量值的增加将减少所研究事件,相应协变量值的增加将减少所研究事件发生的可能性;发生的可能性;当当=0 0,相应协变量与所研究事件的发生无关。,相应协变量与所研究事件的发生无关。5/6/202471安徽医科大学流统系王静制作3 3、模型假设、模型假设满足比例风险(满足比例风险(proportional hazardsproportional hazards)假定,)假定,简称简称PHPH假定假定。即:相对危险度。即:相对危险度RRRR或风险比保持或风险比保持一个恒定的比例,与时间一个恒定的比例,与时间t t无关。无关。5/6/202472安徽医科大学流统系王静制作CoxCox回归无须对回归无须对0 0(t t)的形式作任何限制,因为不的形式作任何限制,因为不影响各危险因素相对危险度的估计,而相对危险影响各危险因素相对危险度的估计,而相对危险度正是多因素分析时最关注的问题。度正是多因素分析时最关注的问题。coxcox模型巧妙地将非参数模型巧妙地将非参数0 0(t t)部分与参数部分与参数(回归系数(回归系数)的概念结合起来,这种灵活性使)的概念结合起来,这种灵活性使得它在生存分析的应用中备受青睐。得它在生存分析的应用中备受青睐。5/6/202473安徽医科大学流统系王静制作比值比比值比OR可以作为相对危险度可以作为相对危险度RR的估计值。的估计值。5/6/202474安徽医科大学流统系王静制作比例风险假设的检验:比例风险假设的检验:可分组(若为可分组(若为0 0、1 1两组)做两组)做二次对数生存率图(二次对数生存率图(Log Log minus Logminus Log,LMLLML),),进行目测判断,若两条曲线有进行目测判断,若两条曲线有交叉或间距变动大,则提示风险比随时间而改变,交叉或间距变动大,则提示风险比随时间而改变,不具备不具备coxcox比例风险模型的适用性;反之,则资料适比例风险模型的适用性;反之,则资料适宜用宜用coxcox比例风险模型。比例风险模型。5/6/202475安徽医科大学流统系王静制作5/6/202476安徽医科大学流统系王静制作4 4、协变量的筛选策略、协变量的筛选策略与其他回归模型类似,如果协变量个数较多,则与其他回归模型类似,如果协变量个数较多,则通常采用逐步法。通常采用逐步法。5/6/202477安徽医科大学流统系王静制作二、二、coxcox回归模型的分析步骤及回归模型的分析步骤及主要结果主要结果5/6/202478安徽医科大学流统系王静制作SPSSSPSS中的程序为:中的程序为:AnalyzeSurvival Cox RegressionAnalyzeSurvival Cox Regression将将coxcox回归的对话框与线性回归、回归的对话框与线性回归、Kaplan-Kaplan-MeierMeier、Life tableLife table做比较。见做比较。见文件文件cox1.savcox1.sav5/6/202479安徽医科大学流统系王静制作示例:评价示例:评价A A、B B两治疗方案对某病的治疗效果。两治疗方案对某病的治疗效果。A A组(组(group=0group=0)1212人,人,B B组(组(group=1group=1)1313人;人;肾功能正常者为肾功能正常者为0 0,不正常者为,不正常者为1 1。应变量是治疗后的生存时间和观察结果(达到终应变量是治疗后的生存时间和观察结果(达到终点还是截尾值);点还是截尾值);groupgroup是研究因素是研究因素x x1 1,肾功能是混杂因素肾功能是混杂因素x x2 2。5/6/202480安徽医科大学流统系王静制作注意事项注意事项一般情况下,截尾值设为一般情况下,截尾值设为0 0,完全数据(即出现终,完全数据(即出现终点事件)为点事件)为1 1;但在具体资料中,没有限制,只;但在具体资料中,没有限制,只要能有两个分别表示完全数据和截尾的数值,结要能有两个分别表示完全数据和截尾的数值,结果不受影响。果不受影响。但是一旦设定后,分析时,但是一旦设定后,分析时,“Status”Status”对话框中的对话框中的终点事件值一定要和资料中吻合,否则结果错误。终点事件值一定要和资料中吻合,否则结果错误。5/6/202481安徽医科大学流统系王静制作SPSSSPSS分析结果如下:分析结果如下:第一步、求第一步、求Cox Cox 比例风险模型比例风险模型5/6/202482安徽医科大学流统系王静制作5/6/202483安徽医科大学流统系王静制作(t t)=)=0 0(t t)e e(1.2431.243group+4.105kidney group+4.105kidney)=0 0(t t)exp(1.243group+4.105kidney)exp(1.243group+4.105kidney)groupgroup、kidneykidney的的P P值分别为值分别为0.0380.038、0.0000.000,均均0.050.05,说明不同治疗方案及肾功能对病,说明不同治疗方案及肾功能对病人的生存有影响。人的生存有影响。5/6/202484安徽医科大学流统系王静制作groupgroup、kidneykidney的的OROR值分别为值分别为3.4663.466、60.67060.670,均大,均大于于1 1,说明接受,说明接受B B治疗方案的病人死亡的风险是接治疗方案的病人死亡的风险是接受受A A治疗方案者的治疗方案者的3.4663.466倍、肾功能不正常的病人倍、肾功能不正常的病人死亡的风险是肾功能正常者的死亡的风险是肾功能正常者的60.67060.670倍。倍。5/6/202485安徽医科大学流统系王静制作第二步、由模型可求出不同状态下的相对第二步、由模型可求出不同状态下的相对危险度危险度RRRR值值5/6/202486安徽医科大学流统系王静制作1、肾功能正常者肾功能正常者接受接受B治疗方案比接受治疗方案比接受A治疗方案治疗方案在某时刻死亡的相对危险度为:在某时刻死亡的相对危险度为:RR=0(t)e(1.243*1+4.105*0)0(t)e(1.243*0+4.105*0)=3.4665/6/202487安徽医科大学流统系王静制作2 2、肾功能不正常者肾功能不正常者接受接受B B治疗方案比接受治疗方案比接受A A治疗治疗方案方案在某时刻死亡的相对危险度为:在某时刻死亡的相对危险度为:RR=RR=0 0(t t)e)e(1.2431.243*1+4.105*1*1+4.105*1)0 0(t t)e)e(1.2431.243*0+4.105*1*0+4.105*1)=3.466 =3.4665/6/202488安徽医科大学流统系王静制作3 3、肾功能不正常者接受肾功能不正常者接受B B治疗方案治疗方案,比,比肾功能正常者肾功能正常者接受接受A A治疗方案治疗方案在某时刻死亡的相对危险度为:在某时刻死亡的相对危险度为:RR=RR=0 0(t t)e)e(1.2431.243*1+4.105*1*1+4.105*1)0 0(t t)e)e(1.2431.243*0+4.105*0*0+4.105*0)=210.300 =210.300可见在可见在CoxCox模型的建立中没有估计基线风险模型的建立中没有估计基线风险0 0(t t);在危险因素的在危险因素的RRRR分析中也没有涉及基线风险。分析中也没有涉及基线风险。所估计的风险比与时间无关。所估计的风险比与时间无关。5/6/202489安徽医科大学流统系王静制作第三步、画出风险函数曲线第三步、画出风险函数曲线5/6/202490安徽医科大学流统系王静制作5/6/202491安徽医科大学流统系王静制作第四步、画出第四步、画出二次对数生存率图二次对数生存率图(Log minus LogLog minus Log,LMLLML)从从LML图中,目测判断图中,目测判断PH假设是否成立。假设是否成立。5/6/202492安徽医科大学流统系王静制作5/6/202493安徽医科大学流统系王静制作目的目的:探讨影响胃癌患者长期生存的预后因素。探讨影响胃癌患者长期生存的预后因素。方法方法:采用采用CoxCox比例风险模型比例风险模型对可能影响胃癌患者预后的对可能影响胃癌患者预后的1111项项临床病理参数进行单因素和多因素回归分析。临床病理参数进行单因素和多因素回归分析。结果结果:Cox:Cox单因素回归分析表明胃癌的分化程度、浸润深度、单因素回归分析表明胃癌的分化程度、浸润深度、淋巴结转移数、脉管内是否有癌栓、临床分期、肿瘤直径、淋巴结转移数、脉管内是否有癌栓、临床分期、肿瘤直径、淋巴细胞浸润量与胃癌的预后有关淋巴细胞浸润量与胃癌的预后有关(P P 0.05),0.05)0.05)。但经但经CoxCox多因素回归分析多因素回归分析,只有肿瘤的直径、脉管内是否有癌只有肿瘤的直径、脉管内是否有癌栓、淋巴细胞浸润量具有独立的预后意义栓、淋巴细胞浸润量具有独立的预后意义(P P 0.05)0.05)。结论结论:肿块大小、脉管内是否有癌栓及局部淋巴细胞浸润量可肿块大小、脉管内是否有癌栓及局部淋巴细胞浸润量可以作为评估胃癌患者预后的独立指标以作为评估胃癌患者预后的独立指标,从而指导胃癌的治疗。从而指导胃癌的治疗。5/6/202494安徽医科大学流统系王静制作5/6/202495安徽医科大学流统系王静制作5/6/202496安徽医科大学流统系王静制作5/6/202497安徽医科大学流统系王静制作5/6/202498安徽医科大学流统系王静制作5/6/202499安徽医科大学流统系王静制作三、应用三、应用coxcox回归模型的注意事项回归模型的注意事项1.1.对应变量的要求(前已阐述);对应变量的要求(前已阐述);2.2.自变量的编码;自变量的编码;3.Cox3.Cox回归必须满足回归必须满足PHPH假设;假设;4.4.建模策略。建模策略。5/6/2024100安徽医科大学流统系王静制作coxcox非比例风险非比例风险模型模型5/6/2024101安徽医科大学流统系王静制作即为即为含时依协变量的含时依协变量的模型模型。时依协变量:效应大小随时间而变化的协变量。时依协变量:效应大小随时间而变化的协变量。模型为:模型为:(t t)=)=0 0(t t)exp*x+)exp*x+x(x(t t)若若 无统计学意义,则该协变量不是无统计学意义,则该协变量不是时依协变量,转时依协变量,转做前面的比例风险做前面的比例风险coxcox模型;反之,则必须引入该时模型;反之,则必须引入该时依协变量。(依协变量。(提示:此模型可用来考察实际资料是否提示:此模型可用来考察实际资料是否满足比例风险模型满足比例风险模型)5/6/2024102安徽医科大学流统系王静制作生存分析中的参数法生存分析中的参数法:分别指定风险函数的形式。分别指定风险函数的形式。5/6/2024103安徽医科大学流统系王静制作指数回归模型中的风险函数指数回归模型中的风险函数h(th(t)分布形式:分布形式:h(th(t)与时间与时间t t无关无关5/6/2024104安徽医科大学流统系王静制作WeibullWeibull回归模型中的风险函数回归模型中的风险函数h(th(t)分布形式分布形式5/6/2024105安徽医科大学流统系王静制作对数正态分布回归模型中的风险函数对数正态分布回归模型中的风险函数h(th(t)分布形式分布形式5/6/2024106安徽医科大学流统系王静制作Log-logisticLog-logistic分布回归模型中的风险函数分布回归模型中的风险函数h(th(t)分布形式分布形式5/6/2024107安徽医科大学流统系王静制作GompertzGompertz分布回归模型中的风险函数分布回归模型中的风险函数h(th(t)分布形- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学生存分析 医学 生存 分析
咨信网温馨提示:
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【w****g】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【w****g】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【w****g】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【w****g】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
关于本文