SPSS线性回归描述.doc
《SPSS线性回归描述.doc》由会员分享,可在线阅读,更多相关《SPSS线性回归描述.doc(12页珍藏版)》请在咨信网上搜索。
SPSS 10.0高级教程十二:多元线性回归与曲线拟合 2009年,国内生物医药的突破之年。不仅有干细胞发现的新突破,还有转基因作物政策的新举措。 回归分析是处理两个及两个以上变量间线性依存关系的统计方法。在医学领域中,此类问题很普遍,如人头发中某种金属元素的含量与血液中该元素的含量有关系,人的体表面积与身高、体重有关系;等等。回归分析就是用于说明这种依存变化的数学关系。 §10.1 Linear过程 10.1.1 简单操作入门 调用此过程可完成二元或多元的线性回归分析。在多元线性回归分析中,用户还可根据需要,选用不同筛选自变量的方法(如:逐步法、向前法、向后法,等)。 例10.1:请分析在数据集Fat surfactant.sav中变量fat对变量spovl的大小有无影响? 显然,在这里spovl是连续性变量,而fat是分类变量,我们可用用单因素方差分析来解决这个问题。但此处我们要采用和方差分析等价的分析方法--回归分析来解决它。 回归分析和方差分析都可以被归入广义线性模型中,因此他们在模型的定义、计算方法等许多方面都非常近似,下面大家很快就会看到。 这里spovl是模型中的因变量,根据回归模型的要求,它必须是正态分布的变量才可以,我们可以用直方图来大致看一下,可以看到基本服从正态,因此不再检验其正态性,继续往下做。 10.1.1.1 界面详解 在菜单中选择Regression==>liner,系统弹出线性回归对话框如下: 除了大家熟悉的内容以外,里面还出现了一些特色菜,让我们来一一品尝。 【Dependent框】 用于选入回归分析的应变量。 【Block按钮组】 由Previous和Next两个按钮组成,用于将下面Independent框中选入的自变量分组。由于多元回归分析中自变量的选入方式有前进、后退、逐步等方法,如果对不同的自变量选入的方法不同,则用该按钮组将自变量分组选入即可。下面的例子会讲解其用法。 【Independent框】 用于选入回归分析的自变量。 【Method下拉列表】 用于选择对自变量的选入方法,有Enter(强行进入法)、Stepwise(逐步法)、Remove(强制剔除法)、Backward(向后法)、Forward(向前法)五种。该选项对当前Independent框中的所有变量均有效。 【Selection Variable框】 选入一个筛选变量,并利用右侧的Rules钮建立一个选择条件,这样,只有满足该条件的记录才会进入回归分析。 【Case Labels框】 选择一个变量,他的取值将作为每条记录的标签。最典型的情况是使用记录ID号的变量。 【WLS>>钮】 可利用该按钮进行权重最小二乘法的回归分析。单击该按钮会扩展当前对话框,出现WLS Weight框,在该框内选入权重变量即可。 【Statistics钮】 弹出Statistics对话框,用于选择所需要的描述统计量。有如下选项: o Regression Coefficients复选框组:定义回归系数的输出情况,选中Estimates可输出回归系数B及其标准误,t值和p值,还有标准化的回归系数beta;选中Confidence intervals则输出每个回归系数的95%可信区间;选中covariance matrix则会输出各个自变量的相关矩阵和方差、协方差矩阵。以上选项默认只选中Estimates。 o Residuals复选框组:用于选择输出残差诊断的信息,可选的有Durbin-Watson残差序列相关性检验、超出规定的n倍标准误的残差列表。 o Model fit复选框:模型拟合过程中进入、退出的变量的列表,以及一些有关拟合优度的检验:,R,R2和调整的R2, 标准误及方差分析表。 o R squared change复选框:显示模型拟合过程中R2、F值和p值的改变情况。 o Descriptives复选框:提供一些变量描述,如有效例数、均数、标准差等,同时还给出一个自变量间的相关矩阵。 o Part and partial correlations复选框:显示自变量间的相关、部分相关和偏相关系数。 o Collinearity diagnostics复选框:给出一些用于共线性诊断的统计量,如特征根(Eigenvalues)、方差膨胀因子(VIF)等。 以上各项在默认情况下只有Estimates和Model fit复选框被选中。 【Plot钮】 弹出Plot对话框,用于选择需要绘制的回归分析诊断或预测图。可绘制的有标准化残差的直方图和正态分布图,应变量、预测值和各自变量残差间两两的散点图等。 【Save钮】 许多时候我们需要将回归分析的结果存储起来,然后用得到的残差、预测值等做进一步的分析,Save钮就是用来存储中间结果的。可以存储的有:预测值系列、残差系列、距离(Distances)系列、预测值可信区间系列、波动统计量系列。下方的按钮可以让我们选择将这些新变量存储到一个新的SPSS数据文件或XML中。 【Options钮】 设置回归分析的一些选项,有: o Stepping Method Criteria单选钮组:设置纳入和排除标准,可按P值或F值来设置。 o Include constant in equation复选框:用于决定是否在模型中包括常数项,默认选中。 o Missing Values单选钮组:用于选择对缺失值的处理方式,可以是不分析任一选入的变量有缺失值的记录(Exclude cases listwise)而无论该缺失变量最终是否进入模型;不分析具体进入某变量时有缺失值的记录(Exclude cases pairwise);将缺失值用该变量的均数代替(Replace with mean)。 10.1.1.2 输出结果解释 根据题目的要求,我们只需要在Dependent框中选入spovl,Independent框中选入fat即可,其他的选项一律不管。单击OK后,系统很快给出如下结果: Regression 这里的表格是拟合过程中变量进入/退出模型的情况记录,由于我们只引入了一个自变量,所以只出现了一个模型1(在多元回归中就会依次出现多个回归模型),该模型中fat为进入的变量,没有移出的变量,具体的进入/退出方法为enter。 上表为所拟合模型的情况简报,显示在模型1中相关系数R为0.578,而决定系数R2为0.334,校正的决定系数为0.307。 这是所用模型的检验结果,可以看到这就是一个标准的方差分析表!有兴趣的读者可以自己用方差分析模型做一下,就会发现出了最左侧的一列名字不太一样外,其他的各个参数值都是相同的。从上表可见所用的回归模型F值为12.059,P值为0.002,因此我们用的这个回归模型是有统计学意义的,可以继续看下面系数分别检验的结果。 由于这里我们所用的回归模型只有一个自变量,因此模型的检验就等价与系数的检验,在多元回归中这两者是不同的。 上表给出了包括常数项在内的所有系数的检验结果,用的是t检验,同时还会给出标化/未标化系数。可见常数项和fat都是有统计学意义的,上表的内容如果翻译成中文则如下所示: 未标准化系数 标准化系数 模型 系数b 系数标准误 系数β t值 P值 1 常数 5.097 0.427 11.923 0.000 fat 0.700 0.202 0.578 3.473 0.002 10.1.2 复杂实例操作 10.1.2.1 分析实例 例10.2:请分析在数据集plastic.sav中变量extrusn、additive、gloss和opacity对变量tear_res的大小有无影响?已知extrusn对tear_res的大小有影响。 显然,这里是一个多元回归,由于除了extrusn确有影响以外,我们不知道另三个变量有无影响,因此这里我们将extrusn放在第一个block,进入方法为enter(我们有把握extrusn一定有统计学意义);另三个变量放在第二个block,进入方法为stepwise(让软件自动选择判断),操作如下: 1. Analyze==>Regression==>Liner 2. Dependent框:选入tear_res 3. Independent框:选入extrusn;单击next钮 4. Independent框:选入additive、gloss和opacity;Method列表框:选择stepwise 5. 单击OK钮 10.1.2.2 结果解释 最终的结果如下: Regression 上面的表格依次列出了模型的筛选过程,模型1用进入法引入了extrusn,然后模型2用stepwise法引入了additive,另两个变量因没有达到进入标准,最终没有进入。上面的表格翻译出来如下: 模型 进入的变量 移出的变量 变量筛选方法 1 extrusn 进入法 2 additive stepwise法(标准:进入概率小于0.05,移出概率大于0.1) 上表是两个模型变异系数的改变情况,从调整的R2可见,从上到下随着新变量的引入,模型可解释的变异占总变异的比例越来越大。 上表是所用两个模型的检验结果,用的方法是方差分析,可见二个模型都有统计学意义。 上表仍然为三个模型中各个系数的检验结果,用的是t检验,可见在模型2中所有的系数都有统计学意义,上表的内容翻译如下: 未标化的系数 标化的系数 模型 B 标准误 Beta t值 P值 1 (常数) 5.900 .265 22.278 .000 extrusion .590 .167 .639 3.522 .000 2 (常数) 5.315 .314 16.926 .000 extrusion .590 .144 .639 4.905 .000 additive .390 .144 .422 2.707 .000 这是新出现的一个表格,反映的是没有进入模型的各个变量的检验结果,可见在模型1中,未引入模型的候选变量additive还有统计学意义,可能需要引入,而模型2中没有引入的两个变量其P值均大于0.05,无需再进行分析了。 10.2 Curve Estimation过程 Curve Estimation过程可以用与拟合各种各样的曲线,原则上只要两个变量间存在某种可以被它所描述的数量关系,就可以用该过程来分析。但这里我们要指出,由于曲线拟合非常的复杂,而该模块的功能十分有限,因此最好采用将曲线相关关系通过变量变换的方式转化为直线回归的形式来分析,或者采用其他专用的模块分析。 10.2.1 界面详解 Curve Estimation过程中有特色的对话框界面内容如下: 下面我们分别解释一下它们的具体功能。 【Dependent框】 用于选入曲线拟和中的应变量,可选入多个,如果这样,则对各个应变量分别拟合模型。 【Independent单选框组】 用于选入曲线拟和中的自变量,有两种选择,可以选入普通的自变量,也可以选择时间作为自变量,如果这样做,则所用的数据应为时间序列数据格式。 【Models复选框组】 是该对话框的重点,用于选择所用的曲线模型,可用的有: · Linear:拟合直线方程,实际上与Linear过程的二元直线回归相同; · Quadratic:拟合二次方程Y = b0+b1X+b2X2; · Compound:拟合复合曲线模型Y = b0×b1X; · Growth:拟合等比级数曲线模型Y = e(b0+b1X); · Logarithmic:拟合对数方程Y = b0+b1lnX; · Cubic:拟合三次方程Y = b0+b1X+b2X2+b3X3; · S:拟合S形曲线Y = e(b0+b1/X); · Exponential:拟合指数方程Y = b0 eb1X; · Inverse:数据按Y = b0+b1/X进行变换; · Power:拟合乘幂曲线模型Y = b0X b1; · Logistic:拟合Logistic曲线模型Y = 1/(1/u + b0×b1X),如选择该线型则要求输入上界。 上面的几种线型和其他的模块有重复,如Logistic、Liner等,由于本模块的功能有限,在重复的情况下建议用其它专用模块来分析。 【Include constant in equation复选框】 确定是否在方程中包含常数项。 【Plot models复选框】 要求对模型做图,包括原始数值的连线图和拟合模型的曲线图。 【save钮】 弹出SAVE对话框,用于定义想要存储的中间结果,如预测值、预测值可信区间、残差等。 【Display ANOVA table复选框】 要求显示模型检验的方差分析表。 10.2.2 实例操作 例10.3:锡克试验阴性率(%)随着年龄的增长而增高,某地查得儿童年龄(岁)X与锡克试验阴性率Y的资料如下,试拟合曲线。 年龄(岁) 1 2 3 4 5 6 7 锡克试验阴性率(%) 57.1 76.0 90.9 93.0 96.7 95.6 96.2 首先对年龄和阴性率作散点图,发现两者有斜率逐渐放缓的曲线趋势,因此选择二次曲线模型、三次曲线模型和对数曲线模型,最终取其中结果最优者,做法如下: 1. Analyze==>Regression==>Curve estimation 2. Dependant框:选入阴性率 3. Independant框:选入年龄 4. Models复选框组:选择Quadratic、Curbe、Logarithmatic,取消对Liner的选择。 5. 单击OK 结果如下: Curve Fit MODEL: MOD_11. Independent: 年龄 Dependent Mth Rsq d.f. F Sigf b0 b1 b2 b3 阴性率 LOG .913 5 52.32 .001 61.3259 20.6704 阴性率 QUA .970 4 65.20 .001 39.2714 21.8250 -2.0036 阴性率 CUB .994 3 165.37 .001 25.5714 37.4278 -6.5702 .3806 上表给出了所拟合的三个模型的检验报告,包括拟合优度、模型的检验结果和各个系数值,从检验结果看,三个模型均有统计学意义,但从拟合优度看,三次方曲线的拟合优度最高,似乎应选择三次方曲线,但注意三次方曲线多一个参数,要复杂一些,而它的拟合优度和二次方曲线相差不大,因此仅从这里的结果还不好对它们两者作出判断,下面我们还要看看模型曲线的情况。 上图是三个模型曲线和实际值连线的情况,可见在4岁以前,二次方和三次方曲线对模型的拟合相差不大,4岁以后三次方曲线则要明显优于二次方曲线,但我们的观察值只有7例,样本量太少,在曲线回归中,模型的简洁性和拟合优度的高低同样重要,拟合优度太高的模型往往对新样本的拟合度较差,我认为在这种情况下选择参数较少的模型为宜,因此最终选择二次方曲线模型。 其实这里由于观察样本太少,无论选择哪种模型影响都不大,而且各人的意见不会相同,往往是有多少条曲线,就会有多少种意见,最后还是要结合专业知识来决定,我这样写只是让大家明白,曲线拟和是非常复杂的问题,千万不能轻易下结论。 (注:专业文档是经验性极强的领域,无法思考和涵盖全面,素材和资料部分来自网络,供参考。可复制、编制,期待你的好评与关注)- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 线性 回归 描述
咨信网温馨提示:
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【w****g】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【w****g】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【w****g】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【w****g】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
关于本文