多元线性回归与多元逐步回归.ppt.ppt
《多元线性回归与多元逐步回归.ppt.ppt》由会员分享,可在线阅读,更多相关《多元线性回归与多元逐步回归.ppt.ppt(34页珍藏版)》请在咨信网上搜索。
第十一章第十一章 多元线性回归与多元逐步回归多元线性回归与多元逐步回归(Multiple Linear Regressionand Multiple Stepwise Regression)华中科技大学同济医学院华中科技大学同济医学院 尹尹 平平例例 子子一个应变量与多个自变量间的关系儿童身高与年龄、性别的关系儿童身高与年龄、性别的关系肺活量与年龄、性别、身高、体重肺活量与年龄、性别、身高、体重以及胸围的呼吸差等因素的关系以及胸围的呼吸差等因素的关系多元线性回归如构成线性依存关系第一节第一节 多元线性回归多元线性回归第二节多元逐步回归第二节多元逐步回归第三节第三节 多元线性回归的注意事项多元线性回归的注意事项第一节第一节 多元线性回归多元线性回归(multiple linear regression)多元线性回归的数据格式多元线性回归的数据格式一、多元线性回归方程(multiplelinearregressionequation)常数项,表示当所有自变量为0时应变量Y的总体平均值的估计值表示除以外的其它自变量固定不变的情况下,每改变一个测量单位时所引起的应变量Y的平均改变量bj为偏回归系数(partialregressioncoefficient)两个自变量与应变量的散点图两个自变量与应变量的散点图两个自变量与应变量的拟合面两个自变量与应变量的拟合面bj 为为 xj方向的斜率方向的斜率1.求偏回归系数求偏回归系数bj及及b0根据最小二乘法根据最小二乘法(method of least square)(method of least square)原理求出原理求出b bj j,即即得到得到bj 2.2.2.2.例例例例 子子子子例例11.1 2011.1 20名糖尿病人的血糖、胰岛素及生长素的测定值列于下表名糖尿病人的血糖、胰岛素及生长素的测定值列于下表中,试建立血糖对于胰岛素及生长素的二元线性回归方程中,试建立血糖对于胰岛素及生长素的二元线性回归方程。对于本例有对于本例有:采用最小二乘法即可求出常数项采用最小二乘法即可求出常数项b b0 0和偏回归系数和偏回归系数b b1 1、b b2 2。其中其中对表对表11-211-2的数据资料由的数据资料由SASSAS统计软件可得到如下统计软件可得到如下表表11-311-3的主要结果。的主要结果。由此得到回归方程为由此得到回归方程为二、回归方程的假设检验二、回归方程的假设检验1.1.模型检验模型检验其中:自由度为总n1,回归k,剩余nk1X2X1YModel SSTotal SSResidual SS由表由表11-4可知,可知,F21.54,P0.05。从而,拒绝。从而,拒绝H0,可以认为,可以认为和和不全为不全为0,即所求回归方程有统计学意义。,即所求回归方程有统计学意义。对于例对于例11.111.1的模型检验的模型检验H H0 0:H H1 1:和和不全为不全为0 0 0.050.05对表对表11-311-3的数据资料,由的数据资料,由SASSAS统计软件可得到如下表统计软件可得到如下表11-411-4的模型检验结果。的模型检验结果。偏回归系数的检验(1 1 1 1)F F F F检验检验检验检验j=1,2,k之中,之中,U U 为为X Xj j 的偏回归平方和的偏回归平方和,即即U U=SS SS回归回归SSSS回归回归(-(-j j)Fj服从F(1,n-k-1)分布表表11-511-5例例11.111.1数据的偏回归系数数据的偏回归系数F F检验表检验表方程内方程内自变量自变量平方和平方和F FP PSSSS回归回归SSSS回归回归-SSSS回归回归(-j)(-j)SSSS残差残差X1,X2X1,X2116.6116.646.02546.025X2X266.27566.27550.35250.35218.59818.5980.00.050.05在在 0.050.05水平上,可以认为胰岛素对血糖的线性回归关系有统计学意义,水平上,可以认为胰岛素对血糖的线性回归关系有统计学意义,而生长素对血糖的线性回归关系无统计学意义。所以应剔除而生长素对血糖的线性回归关系无统计学意义。所以应剔除X X2 2,只建立,只建立X X1 1与与Y Y的线性回归方程。的线性回归方程。(2)(2)t t 检验检验j=1,2,k,P=0.0005;在在0.050.05水平下,认为血糖与胰岛素的线性回归关系水平下,认为血糖与胰岛素的线性回归关系有统计学意义,而与生长素的线性回归关系无统计学意义。有统计学意义,而与生长素的线性回归关系无统计学意义。结论与结论与 F F 检验一致检验一致。,P=0.4110。三、标准化回归系数三、标准化回归系数三、标准化回归系数三、标准化回归系数(stastastastan n n ndardized partial regression coefficient)dardized partial regression coefficient)dardized partial regression coefficient)dardized partial regression coefficient)式中,式中,S Sj j及及S Sy y 分别为自变量分别为自变量X Xj j 及因变量及因变量Y Y 的标准差。的标准差。可以利用标准化偏回归系数的大小可以利用标准化偏回归系数的大小 来反映各自变量的贡献大小。来反映各自变量的贡献大小。复相关系数(复相关系数(复相关系数(复相关系数(multiple correlationmultiple correlationmultiple correlationmultiple correlation coefficientcoefficientcoefficientcoefficient)又称多元相关系数或全相关系数,表示回归方程中的全部自变又称多元相关系数或全相关系数,表示回归方程中的全部自变量量 X X共共 同对应变量同对应变量Y Y的相关密切程度。复相关系数取值总为正的相关密切程度。复相关系数取值总为正值,在值,在0 0与与1 1之间,简记为之间,简记为R R。如果只有一个自变量,此时。如果只有一个自变量,此时 四、四、复相关系数与决定系数复相关系数与决定系数2 2决定系数决定系数(coefficient of determination(coefficient of determination)复相关系数的平方又称决定系数,记为复相关系数的平方又称决定系数,记为 ,用以反映,用以反映线性回归方程能在多大程度上解释应变量线性回归方程能在多大程度上解释应变量Y Y的变异性的变异性。回归方程的拟合程度越好,残差平方和就越小,决定系数回归方程的拟合程度越好,残差平方和就越小,决定系数 越接近越接近1 1,决定系数,决定系数 越接近越接近1 1 第二节多元逐步回归第二节多元逐步回归 (multiple stepwise regression)1.多元逐步回归的基本思想多元逐步回归的基本思想多元逐步回归(多元逐步回归(multiple stepwise regressionmultiple stepwise regression)有三种筛选自变量的方法有三种筛选自变量的方法 :1 1向后法(向后法(Backward selectionBackward selection)先建立一个全因素的回归方程,先建立一个全因素的回归方程,然后每次剔除一个偏回归平方和最小且无统计学意义的自变量,直到不能然后每次剔除一个偏回归平方和最小且无统计学意义的自变量,直到不能剔除时为止,此法的计算量大,有时不能实现。剔除时为止,此法的计算量大,有时不能实现。2 2向前法(向前法(forward selectionforward selection)方程由一个自变量开始,每次引入方程由一个自变量开始,每次引入一个偏回归平方和最大,且具有统计学意义的自变量,由少到多,直到无一个偏回归平方和最大,且具有统计学意义的自变量,由少到多,直到无具有统计意义的因素可以引入为止。用此法建立的方程有时不够精炼。具有统计意义的因素可以引入为止。用此法建立的方程有时不够精炼。3.3.逐步法(逐步法(stepwise stepwise selecfionselecfion)取上述两种方法的优点,在向前引取上述两种方法的优点,在向前引入每一个新自变量之后都要重新对前已选入的自变量进行检查,以评价其入每一个新自变量之后都要重新对前已选入的自变量进行检查,以评价其有无继续保留在方程中的价值。为此引入和剔除交替进行,直到无具有统有无继续保留在方程中的价值。为此引入和剔除交替进行,直到无具有统计学意义的新变量可以引入也无失去其统计学意义的自变量可以剔除时为计学意义的新变量可以引入也无失去其统计学意义的自变量可以剔除时为止。止。2.多元逐步回归的基本原理多元逐步回归的基本原理 每一步只引入或剔除一个自变量。自变量是否被引入或剔除则取每一步只引入或剔除一个自变量。自变量是否被引入或剔除则取决于其偏回归平方和的决于其偏回归平方和的F F检验或校正决定系数。检验或校正决定系数。如方程中已引入了如方程中已引入了(m m-1)-1)个自变量,在此基础上考虑再引入变量个自变量,在此基础上考虑再引入变量X Xj j 。记引入记引入X Xj j 后方程(即含后方程(即含m m个自变量)的回归平方和为个自变量)的回归平方和为SSSS回归回归,残差,残差为为SSSS残差;残差;之前含之前含(m m-1)-1)个自变量(不包含个自变量(不包含X Xj j )方程的回归平方和为)方程的回归平方和为SSSS回归回归(-(-j j),则,则X Xj j 的偏回归平方和为的偏回归平方和为 U U=SS SS回归回归SSSS回归回归(-(-j j),检验统计量,检验统计量为:为:Fj 服从F (1,n-m-1)分布如果如果FjF(1,n-m-1),则,则 Xj选入方程;否则,不入选。选入方程;否则,不入选。从方程中剔除无统计学作用的自变量,过程则相反,但检验一样。从方程中剔除无统计学作用的自变量,过程则相反,但检验一样。3.多元逐步回归的检验水平多元逐步回归的检验水平 在进行逐步回归前,首先应确定检验水平,以作为在进行逐步回归前,首先应确定检验水平,以作为引入或剔除变量的标准。检验水平可以根据具体情况而引入或剔除变量的标准。检验水平可以根据具体情况而定,一般可将定,一般可将 F F 值定在值定在 为为0.050.05、0.100.10或或0.200.20水平上。水平上。对于回归方程的选入和剔除水平往往选择对于回归方程的选入和剔除水平往往选择 选入选入 剔除剔除。选择不同的选择不同的F F 值值(或或 水平水平),其回归方程的结果可,其回归方程的结果可能不一致,一般可选不同的能不一致,一般可选不同的F F 值值(或或 值值)作调试。至于作调试。至于何种结果是正确的,必须结合医学的实际意义来确定何种结果是正确的,必须结合医学的实际意义来确定。4.多元逐步回归事例多元逐步回归事例 对例对例11.211.2采用逐步法筛选自变量,选入水准为采用逐步法筛选自变量,选入水准为 0.10,0.10,剔剔除水准为除水准为0.150.15,SAS SAS 软件计算过程及相应结果见表软件计算过程及相应结果见表11-811-8至至 表表11-1111-11。多元逐步回归方程为:多元逐步回归方程为:第三节第三节多元线性回归的注意事项多元线性回归的注意事项1.1.1.1.应用条件应用条件应用条件应用条件(1 1)线性依存关系线性依存关系 应变量与自变量间具有线应变量与自变量间具有线性依存关系。性依存关系。(2 2)正态性正态性 应变量原则上是连续型可测正态应变量原则上是连续型可测正态变量,其预测值与实际观测值的差值(即残差)服从变量,其预测值与实际观测值的差值(即残差)服从正态分布,当样本量较大时可以忽略正态性的要求。正态分布,当样本量较大时可以忽略正态性的要求。(3 3)独立性)独立性 观察单位之间是独立的,即应变量观察单位之间是独立的,即应变量的观测值相互独立。的观测值相互独立。2.2.样本含量样本含量 一般应使样本量是自变量个数的一般应使样本量是自变量个数的一般应使样本量是自变量个数的一般应使样本量是自变量个数的 5 5 5 5 倍以上。倍以上。倍以上。倍以上。3.3.自变量的数量化自变量的数量化 注意名义变量的数量化。注意名义变量的数量化。4.4.筛选自变量的检验水平筛选自变量的检验水平 要考虑入选变量的实际意义。要考虑入选变量的实际意义。5.5.多重共线性多重共线性 可采用主成分分析或因子分析等方法构建新可采用主成分分析或因子分析等方法构建新的自变量后再进行多元线性回归来消除多重共的自变量后再进行多元线性回归来消除多重共线性。线性。谢谢 谢谢 !- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 完整版 多元 线性 回归 逐步回归 ppt
咨信网温馨提示:
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【a199****6536】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【a199****6536】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【a199****6536】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【a199****6536】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
关于本文