流行病学常用多因素回归统计分析.pptx
《流行病学常用多因素回归统计分析.pptx》由会员分享,可在线阅读,更多相关《流行病学常用多因素回归统计分析.pptx(77页珍藏版)》请在咨信网上搜索。
1、Epidemiology&Statistics流行病学资料的多因素回归分析郑卫军郑卫军 流行病学与卫生统计学教研室流行病学与卫生统计学教研室 disease disease source source gene gene environment environment health health habit habit SES SES gender gender age age?Example of complexity of medical studyExample of complexity of medical studyExample of complexity in medical
2、studyExample of complexity in medical studyphysicalactivity eatingdrinkingsmokingsocial economic statusenduredglucosebloodpressureweightcholesteroldiabetescoronary heart diseaseenvironmentlife styleendogeneousfactorsdiseases流行病学多变量分析工具回归多因素、多元线性回归多因素、多元logistic回归COX 比例风险模型主成分分析因子分析聚类判别分析路径分析结构方程模型本章
3、我们来交流点什么?多因素线性回归多因素logistic回归多因素COX 回归本讲学习目标掌握多因素回归的技巧及注意点一、多因一果的回归分析方法比较研究实验因素与疗效实验组VS对照组:t检验、卡方、秩和、方差分析相关性研究相关分析回归分析多因素问题常见情况常见于观察性研究探讨多个因素作用模式分析由于分组不均衡造成存在着混杂因素实验性研究也可以遇到。基本的处理方法:多因素回归举例 关于胰脏癌病人生存时间的研究。该研究的终点为死亡,包括很多可能影响生存的因素本例目标分析影响生存的多个因素,因素间地位平等举例 关于胰脏癌病人生存时间的研究。该研究的终点为死亡,探讨术中放疗对生存的影响本例目标探讨术中放
4、疗较未放疗是否影响生存,其它为混杂因素,需要排除混杂干扰COXCOX回归分析结果回归分析结果多因素回归多因素线性回归:因变量定量资料多因素logistic回归:因变量是分类资料(常见二分类)多因素Poisson回归:因变量是泊松分布资料多因素COX比例风险模型:因变量是时间生存资料多因素回归的自变量:可以是定量,也可以是分类资料不同方法的应用场合病例对照研究?队列研究?实验性研究?不同方法的应用场合线性回归 队列/实验性研究Logistic回归 病例对照/队列/实验性研究Poisson回归 队列COX模型 队列/实验性研究思考:什么样的设计?采用什么样的方法?思考:什么样的设计?采用什么样的方
5、法?例1 某研究者跟踪随访已发病冠心病病人,研究病人的年龄age、性别sex(0为女性、1为男性)、心电图检验是否异常ecg(ST段压低、0为正常、1为轻度异常、2为重度异常)与冠心病ca复发是否有关。例1 某研究者希望研究病人的年龄age、性别sex(0为女性、1为男性)、心电图检验是否异常ecg(ST段压低、0为正常、1为轻度异常、2为重度异常)与冠心病ca发病是否有关。横截面研究可以做多因素回归吗?横截面调查的数据疾病:心血管病、高血压相关因素:性别、年龄、红肉日均摄入量、吸烟、饮酒、高血糖、血管弹性指数横截面研究可以做多因素回归吗?横截面调查的数据疾病:心血管病、高血压相关因素:性别、
6、年龄、红肉日均摄入量、吸烟、饮酒、高血糖、血管弹性指数哪些因素可以做呢?横截面研究可以做多因素回归吗?横截面调查的数据疾病:心血管病、高血压相关因素:性别、年龄、红肉日均摄入量、吸烟、饮酒、高血糖、血管弹性指数固有的因素,理论上和结局时间逻辑明确的因素可以开展多因素回归分析多因素回归的注意点样本量回归方程中,因素的筛选多重共线性问题样本量线性回归:纳入回归模型变量数的5-10倍Logistic回归:阳性数纳入模型变量数的5-10倍,总样本量至少乘以2样本量过少,则导致抽样误差增加,回归模型拟合效果变差因素筛选1.常见方法单因素加多因素方法 即单因素回归P值0.05,0.1,0.2的纳入模型分析
7、。此举是为了减少变量个数,提高拟合效果最优子集方程法(逐步回归法)向前法向后法逐步法单因素加多因素逐步回归法24(1)前进法(2)后退法(3)逐步法自变量从无到有、从少到多自变量从无到有、从少到多 先将全部自变量放入方程,然后逐步剔除先将全部自变量放入方程,然后逐步剔除 双向筛选:引入有意义的变量(前进法),剔除无意义双向筛选:引入有意义的变量(前进法),剔除无意义变量(后退法)变量(后退法)最优方程筛选25逐步回归分析的基本思想-拟合效果线性回归 保证纳入因素后,模型的R2值最大Logistic等回归方法 AIC值、SC 值或-2 log likelihood值越小好26因素筛选注意事项如果
8、有变量的引入导致具有关键作用的因子其统计学意义发生改变(从无到有,或从有到无),必须发现原因!是否由于样本量过少,变量过多导致是否存在多重共线性是否属于混杂因素是否属于中间变量:回归模型不能同时纳入影响因素及其中间变量27多重共线性是指在进行多因素回归分析时,自变量间存在较强的线较强的线性相关关系。性相关关系。共线关系的存在,可使得估计系数方差加大,系数估计不稳,结果分析困难。因此在回归分析时,特别是当回归结果难以用专业知识解释时,要进行共线性诊断,找出存在共线性且不重要的那些自变量,剔出方程,另行回归分析。对于存在共线性的资料,可以利用共线性诊断有选择的保留自变量以消除共线性;或者采用岭回归
9、岭回归、主成分回归主成分回归等回归分析方法以避免共线性指标对结果的影响。多重共线性问题28多重共线性多重共线性的表现的表现在实际应用中主要表现为:在实际应用中主要表现为:(1)模型拟合效果很好,但偏回归系数几乎都无统计学意义;(2)偏回归系数估计值的方差很大;(3)偏回归系数估计值不稳定,随着样本含量的增减各偏回归系数发生较大变化或当一个自变量被引入或剔除时其余变量偏回归系数有很大变化;(4)偏回归系数估计值的大小与符号可能与事先期望的不一致或与经验相悖,结果难以解释 出现以上情况,提示存在出现以上情况,提示存在多重共线性多重共线性问题,应进行问题,应进行多重共线多重共线性性诊断。诊断。回归案
10、例分析回归案例分析(logisticlogistic)某妇幼保健院采用病例对照研究探索乳腺增生的影响因素。随机抽取某年在本院就诊的200名乳腺增生患者及200名非乳腺增生患者,采用问卷调查法对各种可能的影响因素进行调查,以探索乳腺增生的危险因素。回归案例分析回归案例分析1 1:单因素分析:单因素分析回归案例分析回归案例分析单因素分析初步结论:由于年龄的影响在单因素分析中无统计学意义,且OR值也较为接近1,在多因素分析中不再考虑年龄因素,仅对其它4个因素进行分析。回归案例分析回归案例分析多因素分析结果:回归案例分析回归案例分析多因素分析小结:为什么rs变得无统计学意义了?相关分析结果显示,妊娠次
11、数与流产次数具有较强的相关性(r=0.55,P=25与初产年龄=25与初产年龄25岁的人相比,其效应(参数估计值)为0.2717+1.4587=1.7304。回归案例分析回归案例分析本例结论:流产次数多是乳腺增生的危险因素,初产年龄和是否母乳喂养的交互作用对乳腺增生的影响也有统计学意义。初产年龄25且非母乳喂养的人,其乳腺增生的危险明显增高。而单纯初产年龄25的人,或单纯非母乳喂养的人,发生乳腺增生的危险并不高。这提示可针对不同人群开展不同的干预措施。回归案例分析回归案例分析当混杂混入流行病学匹配分层多因素回归多因素回归匹配多因素回归倾向得分多因素回归倾向得分回归中的混杂因素混杂因素的识别:(
12、1)该因素对结局有影响,可利用单因素回归或2检验来验证。(2)该因素在分析因素中的分布不均衡,可用2检验验证一下。(3)从专业角度来判断,即该因素不能是分析因素与结局关系的一个中间环节。也就是说,不能是分析因素引起该因素,通过该因素再引起结局。这一点主要根据专业知识来确定。如果同时满足这三个条件,基本可以断定是混杂因素。如果有一条不满足,该因素就不是混杂因素。回归中的混杂因素回归中的混杂因素例2:分析性别、吸烟对幽门螺杆菌(HP)的影响,判断吸烟是否是混杂因素性别性别吸烟吸烟状况状况HP阴性阴性HP阳性阳性男男不不吸烟吸烟146343吸烟吸烟64178女女不不吸烟吸烟211吸烟吸烟110530
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 流行病学 常用 因素 回归 统计分析
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【w****g】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【w****g】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。