spss回归分析相关分析.pptx
《spss回归分析相关分析.pptx》由会员分享,可在线阅读,更多相关《spss回归分析相关分析.pptx(57页珍藏版)》请在咨信网上搜索。
相关分析相关分析 Correlations线性相关:性相关:当一个变量的值发生变化时,另外的一个变量也发生大致相同的变化。(+-)非非线性相关:性相关:如果一个变量发生变动,另外的变量也随之变动,但是,其观察值分布近似的在一条曲线上。2024/5/21 周二1如果仅仅研究变量之间的相互关系的密切程度和变化趋势,并用适当的统计指标描述。这就是相关分析。如果要把变量间相互关系用函数表达出来,用一个或多个变量的取值来估计另一个变量的取值,这就是回归分析。绘制散点散点图和计算相关系数是相关分析最常用的工具,它们的相互结合能够达到较为理想的分析效果相关分析相关分析 Correlations2024/5/21 周二2是将数据以点的形式画在直角坐标系上,通过观察散点图能够直观的发现变量间的相关关系及它们的强弱程度和方向。散点散点图:完全负相关负相关无相关完全正相关正相关无相关2024/5/21 周二3实际操作:2024/5/21 周二4简单散点散点图:生成一:生成一对相关相关变量的散点量的散点图重叠散点重叠散点图:生成多:生成多对相关相关变量的散点量的散点图矩矩阵散点散点图:同:同时生成多生成多对相关相关变量的矩量的矩阵散点散点图三三维散点散点图:生:生产成三个成三个变量之量之间的三的三维散点散点图相关分析相关分析 Correlations2024/5/21 周二5表示一对变量间统计关系的散点图将纵轴变量选入【Y 轴】,将横轴变量选入【X轴】,将分组变量选入【设置标记】:用该变量分组,并在一张图上用不同颜色绘制若干个散点图。将标记变量选入【标注个案】:将标记变量的各变量值标记在散点图相应点的旁边。简单散点散点图:2024/5/21 周二6计算相关系数:利用相关系数进行变量间线性关系的分析通常需要完成以下两个步骤:1.计算算样本相关系数本相关系数r;相关系数r的取值在-1-+1之间r0表示两变量存在正的线性相关关系;r0.8表示两变量有较强的线性关系;|r|40)必必须是是连续变量量2024/5/21 周二35多元回多元回归方程中的自方程中的自变量量选择强行行进入法(入法(enter),即一般所称的复回),即一般所称的复回归分析法。分析法。强迫所有迫所有变量有量有顺序地序地进入回入回归方程。在研究方程。在研究设计中,如果研究者事先建立假中,如果研究者事先建立假设,决定,决定变量的重要性量的重要性层次,次,则应使用使用enter法比法比较合适。此法又称合适。此法又称“层次式次式进入法入法”(hierarchical enter)后退法(后退法(Backward),将已),将已纳入方程的入方程的变量按量按对因因变量的量的贡献大献大小由小到大依次剔除,每剔除一个自小由小到大依次剔除,每剔除一个自变量,即重新量,即重新检验每一自每一自变量量对因因变量的量的贡献。献。前前进法(法(Forward),),对已已纳入方程的入方程的变量不考察其量不考察其显著性,直著性,直到方程外到方程外变量均达不到入量均达不到入选标准。准。强制剔除法(制剔除法(Remove)与后退法相同,只是)与后退法相同,只是筛选的是的是Block2024/5/21 周二36逐步回逐步回归法法 Stepwise运用很广,运用很广,报告中出告中出现的几率最高。的几率最高。结合了前合了前进法和后退法的法和后退法的优点。第一,模型中先不包含任何点。第一,模型中先不包含任何预测变量,与因量,与因变量相关最量相关最高者首先高者首先进入回入回归方程;第二,控制回方程;第二,控制回归方程中的方程中的变量后,根量后,根据每个据每个预测变量与因量与因变量的偏相关的高低来决定量的偏相关的高低来决定进入方程的入方程的顺序;第三,已序;第三,已进入方程的自入方程的自变量,每引入一个自量,每引入一个自变量,就量,就对方方程中的每一自程中的每一自变量量进行行显著性著性检验,若,若发现不不显著,就剔除;著,就剔除;每剔除一个自每剔除一个自变量有也量有也对留在方程中的自留在方程中的自变量再量再进行行显著性著性检验,再不,再不显著,又剔除,直至没有自著,又剔除,直至没有自变量引入,也没有自量引入,也没有自变量量剔除剔除为止。止。在在选择回回归的方法的方法时,注意,注意专业上的要求要先于上的要求要先于统计学学检验的准的准则。Hower(1987)建)建议:(:(1)应优先使用先使用enter或或stepwise。(。(2)使用)使用enter时,可根据研,可根据研究究计划划时的相关理的相关理论,决定,决定变量投入的量投入的顺序。序。2024/5/21 周二37通通过样本数据建立回本数据建立回归方程后一般不能立即用于方程后一般不能立即用于对实际问题的分的分析和析和预测,通常要,通常要进行各种行各种统计检验.包括回包括回归方程的方程的拟合合优度度检验回回归方程的方程的显著性著性检验回回归系数的系数的显著性著性检验残差分析等残差分析等2024/5/21 周二38拟合合优度度检验检验样本数据点聚集在回本数据点聚集在回归线周周围的密集程度,从而的密集程度,从而评价回价回归方方程程对样本数据的代表程度。本数据的代表程度。认为y各各观测值的之的之间的差异主要由两个方面的原因造成:一是的差异主要由两个方面的原因造成:一是解解释变量量x取取值的不同造成的;二是由于其他随机因素造成的。的不同造成的;二是由于其他随机因素造成的。SST=SSA+SSE(回(回归平方和剩余平方和)平方和剩余平方和)若若SSA所占的比例所占的比例远大于大于SSE所占的比例,那么回所占的比例,那么回归方程的方程的拟合合优度会比度会比较高。高。2024/5/21 周二39拟合合优度度检验采用采用R2统计量,量,该统计量称量称为判定系数或决定系数,判定系数或决定系数,它是它是SSA/SST反映因反映因变量的全部量的全部变异中能异中能够通通过回回归关系被自关系被自变量解量解释的比例,的比例,即即检验回回归的效果如何。的效果如何。如果自如果自变量的个数很多,有量的个数很多,有时要以要以调整后的决定系数代替原先的整后的决定系数代替原先的决定系数。因决定系数。因为增加新的自增加新的自变量会使决定系数增大,量会使决定系数增大,这种决定系种决定系数会有高人数会有高人为控制的机制在内,此控制的机制在内,此时用用调整后的决定系数更好整后的决定系数更好拟合合优度度检验2024/5/21 周二40显著性著性检验线性回性回归方程能方程能够较好地反映被解好地反映被解释变量和解量和解释变量之量之间统计关关系的前提系的前提应是,被解是,被解释变量和解量和解释变量之量之间确确实存在存在显著的著的线性性关系。回关系。回归方程的方程的显著性著性检验正是要正是要检验被解被解释变量与所有解量与所有解释变量之量之间的的线性关系是否性关系是否显著,用著,用线性模型来描述它性模型来描述它们之之间的关的关系是否恰当。系是否恰当。基本出基本出发点与点与拟合合优度度检验非常相似。非常相似。检验采用采用F统计量。量。主要目的是研究回主要目的是研究回归方程中的每个解方程中的每个解释变量与被解量与被解释变量之量之间是是否存在否存在显著的著的线性关系,也就是研究解性关系,也就是研究解释变量能量能够有效地解有效地解释被被解解释变量的量的线性性变化,他化,他们能能够保留在保留在线性回性回归方程中。方程中。是是围绕回回归系数估系数估计值的抽的抽样分布展开的,由此构造服从某种理分布展开的,由此构造服从某种理论分布的分布的检验统计量,并量,并进行行检验。2024/5/21 周二41t统计量:在一元量:在一元线性回性回归分析中,回分析中,回归方程方程显著性著性检验和回和回归系系数数显著性著性检验的作用是相同的,两者可以相互代替,同的作用是相同的,两者可以相互代替,同时回回归方方程程显著性著性检验中中Ft2。但在多元但在多元线性回性回归中的中的这两种两种检验通常不能互相替代。通常不能互相替代。2024/5/21 周二42残差分析所所谓残差是指由回残差是指由回归方程方程计算所得的算所得的预测值与与实际样本本值之之间的的差距。差距。残差分析是回残差分析是回归方程方程检验中的重要中的重要组成部分,其出成部分,其出发点是,如果点是,如果回回归方程能方程能较好地反映被解好地反映被解释变量的特征和量的特征和变化化规律,那么残差律,那么残差序列中序列中应不包含明不包含明显的的规律行和律行和趋势性。性。残差分析的主要任残差分析的主要任务可大致可大致归纳为,分析残差是否服从均,分析残差是否服从均值为0的正的正态分布、分析残差是否分布、分析残差是否为等方差的正等方差的正态分布、分析残差序列分布、分析残差序列是否独立、借助残差探是否独立、借助残差探测样本中的异常本中的异常值等。等。图形分析和数形分析和数值分析是残差分析的有效工具分析是残差分析的有效工具2024/5/21 周二43如何看回如何看回归结果?果?哪些自哪些自变量(我量(我们选定)定)进入了回入了回归方程方程对回回归方程方程进行行检验,看方程是否有意,看方程是否有意义看回看回归效果,效果,R22024/5/21 周二44回回归分析的三个重要指分析的三个重要指标方差分析:方差分析:F检验用于用于检验回回归模型与数据的模型与数据的拟合程度。若合程度。若F值显著,表明著,表明预测变量与指量与指标变量之量之间存在很存在很强的的线性关系,也可以性关系,也可以说回回归方程方程显著。著。回回归系数的系数的显著性著性检验:若:若b显著,著,则表明表明预测变量与指量与指标变量量之之间存在存在强线性相关。性相关。R2:解:解释回回归平方和在平方和在总平方和中所占的比率,即解平方和中所占的比率,即解释回回归的效的效果。果。2024/5/21 周二45虚虚拟变量量若某个自若某个自变量是分量是分类变量,量,则须将分将分类变量量转化化为二二进制虚制虚拟变量量(dummy variable),每个虚),每个虚拟变量只代表量只代表2级(0,1),即某一属性出),即某一属性出现时,虚,虚拟变量取量取值为1,否,否则为0。设虚虚拟变量量时,以一种取,以一种取值作作为对比水平(基比水平(基础水平),若原自水平),若原自变量有几量有几个水平,就个水平,就应使用使用n-1个虚个虚拟变量,量,实则虚虚拟变量代表的是同一量代表的是同一变量的不量的不同取同取值如性如性别变量有男或女两量有男或女两类,可将两个可将两个类别分分别以两个以两个0/1二二值变量的量的形式重新形式重新编码。设置置变量量X1表示是否男,取表示是否男,取1表示男,取表示男,取0表示不是男。再表示不是男。再设置置变量量X2表示是否女,取表示是否女,取1表示是女,取表示是女,取0表示不是女表示不是女。产生的回生的回归方程中各虚方程中各虚拟变量回量回归系数的含系数的含义是,相是,相对参照参照类,各个,各个类对解解释变量平均量平均贡献的差,献的差,进而可而可进一步研究各一步研究各类别间对被解被解释变量的平均量的平均贡献差异。献差异。2024/5/21 周二46共共线性性诊断断 Collinearity diagnostics复共复共线问题(共(共线性,性,collinearity问题):由于自):由于自变量量间的相关太的相关太高,造成回高,造成回归分析之情境困分析之情境困扰。如果自。如果自变量量间有共有共线性性问题,表示,表示一个一个预测变量是其他自量是其他自变量的量的线性性组合。若有合。若有严重的共重的共线性存在,性存在,则模型的参数就不能完全被估模型的参数就不能完全被估计出来。出来。2024/5/21 周二47(1)VIF=5,存在复共存在复共线。所以在回。所以在回归分析中,分析中,最好先做个相关分析,最好先做个相关分析,以探以探讨变量量间的相关情形,的相关情形,如果某些如果某些变量量间的相关系数太高,可考的相关系数太高,可考虑挑挑选一个一个较重要的重要的变量投入回量投入回归分析分析。(2)容忍度)容忍度tolerance=1-R2,其中,其中R2是此自是此自变量与其他自量与其他自变量量间的多的多元相关系数的平方。容忍度界于元相关系数的平方。容忍度界于0和和1之之间,如果一个自,如果一个自变量的容忍度太量的容忍度太小,表示此小,表示此变量与其他自量与其他自变量量间有共有共线性性问题;其;其值若接近若接近0,表示此,表示此变量几乎就是其他量几乎就是其他变量的量的线性性组合。合。(3)条件指)条件指针(condition index,CI),),CI 越大,越有共越大,越有共线性性问题。Eigenvalue condition index(k)若)若k2=100表示存在复共表示存在复共线,若,若k2=1000,表示存在,表示存在严重的复共重的复共线。关于复共关于复共线问题,也有,也有说法,即法,即认为若若torrence降至降至0.5以下,而以下,而VIF 上上升到升到2.0以上,就以上,就应检查自自变量是否量是否为自相关。自相关。2024/5/21 周二48对于于一元回一元回归,若散点,若散点图的的趋势不呈不呈线性分布,可以利用曲性分布,可以利用曲线估估计方便地方便地进行行线性性拟合合(liner)、二次、二次拟合合(Quadratic)、三次、三次拟合合(Cubic)等。采用哪种等。采用哪种拟合方式主要取决于各种合方式主要取决于各种拟合模型合模型对数据的数据的充分描述充分描述(看修正看修正Adjusted R2-1)2024/5/21 周二49二二项Logistic回回归利用多元回利用多元回归方法分析方法分析变量之量之间的关系或的关系或进行行预测时的的一个基本要求是,被解一个基本要求是,被解释变量量应是是连续定距定距变量。如量。如课题数、教育支出数、教育支出实际应用中用中这种要求未必能种要求未必能够得到得到较好的好的满足。例如,足。例如,要分析消要分析消费群体的特征群体的特征对汽汽车消消费的影响中,的影响中,职业、性、性别、年、年龄等并不是等并不是连续变量,不能量,不能满足回足回归分析的要求,分析的要求,且是个且是个较普遍存在的普遍存在的问题。2024/5/21 周二50Logistic 回回归Logistic 回回归是多元是多元线性回性回归方法不断方法不断发展的成果。展的成果。其将被解其将被解释变量量设置成置成“是是”或者或者“否否”:在:在现实中,中,经常需要判断常需要判断一些事情是否将要一些事情是否将要发生,候生,候选人是否会当人是否会当选?为什么一些人易患冠心什么一些人易患冠心病?病?为什么一些人的生意会什么一些人的生意会获得成功?此得成功?此问题的特点是因的特点是因变量只有两量只有两个个值,不,不发生生(0)和和发生生(1)。这就要求建立的模型必就要求建立的模型必须因因变量的取量的取值范范围在在01之之间。2024/5/21 周二51Logistic回回归模型模型Logistic 模型:在模型:在逻辑回回归中,可以直接中,可以直接预测观测变量量相相对于某一事件的于某一事件的发生概率。包含一个自生概率。包含一个自变量的回量的回归模模型和多个自型和多个自变量的回量的回归模型公式模型公式:其中其中:z=B0+B1X1+BpXp(P为自自变量个数某一事件不量个数某一事件不发生的概率生的概率为Prob(no event)1-Prob(event)。因此。因此最主要的是求最主要的是求B0,B1,Bp(常数和系数常数和系数)2024/5/21 周二52大部分人还是说不清楚,然后可以尝试分析这些原因是否继续愿意献血与性别之间的,这是否还有意义呢2024/5/21 周二53实际操作2024/5/21 周二542024/5/21 周二552024/5/21 周二562024/5/21 周二57- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- spss 回归 分析 相关
咨信网温馨提示:
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【天****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【天****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【天****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【天****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
关于本文