第十一章统计学一元线性回归.ppt
《第十一章统计学一元线性回归.ppt》由会员分享,可在线阅读,更多相关《第十一章统计学一元线性回归.ppt(88页珍藏版)》请在咨信网上搜索。
第第11章章 一元一元线线性回性回归归11.1 变变量量间间关系的度量关系的度量 11.2 一元一元线线性回性回归归11.3 利用回利用回归归方程方程进进行估行估计计和和预测预测11.4 残差分析残差分析1.学学习习目目标标1.相关关系的分析方法相关关系的分析方法2.一元一元线线性回性回归归的基本原理和参数的最小的基本原理和参数的最小二乘估二乘估计计3.回回归归直直线线的的拟拟合合优优度度4.回回归归方程的方程的显显著性著性检验检验5.利用回利用回归归方程方程进进行估行估计计和和预测预测6.用用 Excel 进进行回行回归归2.重点重点 1.1.一元一元线线性回性回归归分析分析 2.2.用用软软件件进进行回行回归归分析分析 难难点点 最小二乘法的原理并用它解决最小二乘法的原理并用它解决最小二乘法的原理并用它解决最小二乘法的原理并用它解决实际问题实际问题实际问题实际问题本章教学重点与本章教学重点与难难点点3.11.1 变变量量间间关系的度量关系的度量11.1.1 变变量量间间的关系的关系11.1.2 相关关系的描述与相关关系的描述与测测度度11.1.3 相关系数的相关系数的显显著性著性检验检验4.变变量量间间的关系的关系5.函数关系函数关系1.是一一是一一对应对应的确定关系的确定关系2.设设有有两两个个变变量量 x 和和 y,变变量量 y 随随变变量量 x 一一起起变变化化,并并完完全全依依赖赖于于 x,当当变变量量 x 取取某某个个数数值值时时,y 依依确确定定的的关关系系取取相相应应的的值值,则则称称 y 是是 x 的的函函数数,记记为为 y=f(x),其其中中 x 称称为为自自变变量量,y 称称为为因因变变量量3.各各观测观测点落在一条点落在一条线线上上 x xy y6.函数关系函数关系(几个例子几个例子)n n某某种种商商品品的的销销售售额额y与与销销售售量量x之之间间的的关关系系可表示可表示为为 y=px(p 为单为单价价)n n圆圆的的面面积积S与与半半径径R之之间间的的关关系系可可表表示示为为S=R2 n n企企业业的的原原材材料料消消耗耗额额y与与产产量量x1、单单位位产产量量消消耗耗x2、原原材材料料价价格格x3之之间间的的关关系系可可表表示示为为 y=x1 x2 x3 7.相关关系相关关系(correlation)1.变变量量间间关关系系不不能能用用函函数数关关系精确表达系精确表达2.一一个个变变量量的的取取值值不不能能由由另另一个一个变变量唯一确定量唯一确定3.当当变变量量 x 取取某某个个值值时时,变变量量 y 的取的取值值可能有几个可能有几个4.各各观测观测点分布在直点分布在直线线周周围围 x xy y8.相关关系相关关系(几个例子几个例子)n n父父亲亲身高身高y与子女身高与子女身高x之之间间的关系的关系n n收入水平收入水平y与受教育程度与受教育程度x之之间间的关系的关系n n粮粮食食单单位位面面积积产产量量y与与施施肥肥量量x1、降降雨雨量量x2、温度温度x3之之间间的关系的关系n n商品的消商品的消费费量量y与居民收入与居民收入x之之间间的关系的关系n n商品商品销销售售额额y与广告与广告费费支出支出x之之间间的关系的关系9.相关关系相关关系(类类型型)10.相关关系的描述与相关关系的描述与测测度度(散点散点图图)11.相关分析及其假定相关分析及其假定1.相关分析要解决的相关分析要解决的问题问题变变量之量之间间是否存在关系?是否存在关系?如果存在关系,它如果存在关系,它们们之之间间是什么是什么样样的关系?的关系?变变量之量之间间的关系的关系强强度如何?度如何?样样本本所所反反映映的的变变量量之之间间的的关关系系能能否否代代表表总总体体变变量量之之间间的关系?的关系?2.为为解解决决这这些些问问题题,在在进进行行相相关关分分析析时时,对对总总体体有有以下两个主要假定以下两个主要假定两个两个变变量之量之间间是是线线性关系性关系两个两个变变量都是随机量都是随机变变量量12.散点散点图图(scatter diagram)不相关不相关不相关不相关不相关不相关 负线负线负线负线负线负线性相关性相关性相关性相关性相关性相关 正正正正正正线线线线线线性相关性相关性相关性相关性相关性相关 非非非非非非线线线线线线性相关性相关性相关性相关性相关性相关 完全完全完全完全完全完全负线负线负线负线负线负线性相关性相关性相关性相关性相关性相关完全正完全正完全正完全正完全正完全正线线线线线线性相关性相关性相关性相关性相关性相关 13.散点散点图图(例例题题分析分析)【例例】一一家家大大型型商商业业银银行行在在多多个个地地区区设设有有分分行行,其其业业务务主主要要是是进进行行基基础础设设施施建建设设、国国家家重重点点项项目目建建设设、固固定定资资产产投投资资等等项项目目的的贷贷款款。近近年年来来,该该银银行行的的贷贷款款额额平平稳稳增增长长,但但不不良良贷贷款款额额也也有有较较大大比比例例的的增增长长,这这给给银银行行业业务务的的发发展展带带来来较较大大压压力力。为为弄弄清清楚楚不不良良贷贷款款形形成成的的原原因因,管管理理者者希希望望利利用用银银行行业业务务的的有有关关数数据据做做些些定定量量分分析析,以以便便找找出出控控制制不不良良贷贷款款的的办办法法。下下面面是是该该银银行行所属的所属的25家分行家分行2002年的有关年的有关业务业务数据数据 14.散点散点图图(例例题题分析分析)15.散点散点图图(不良不良贷贷款款对对其他其他变变量的散点量的散点图图)16.相关关系的描述与相关关系的描述与测测度度(相关系数相关系数)17.相关系数相关系数(correlation coefficient)1.度量度量变变量之量之间间关系关系强强度的一个度的一个统计统计量量2.对对两两个个变变量量之之间间线线性性相相关关强强度度的的度度量量称称为为简简单单相相关系数关系数3.若若相相关关系系数数是是根根据据总总体体全全部部数数据据计计算算的的,称称为为总总体相关系数,体相关系数,记为记为 4.若若是是根根据据样样本本数数据据计计算算的的,则则称称为为样样本本相相关关系系数数,简简称称为为相关系数,相关系数,记为记为 r也也 称称 为为 线线 性性 相相 关关 系系 数数(linear correlation coefficient)或或称称为为Pearson相相关关系系数数(Pearsons correlation coefficient)18.相关系数相关系数(计计算公式算公式)样样本相关系数的本相关系数的计计算公式算公式或化或化简为简为19.相关系数的性相关系数的性质质性性质质1:r 的取的取值值范范围围是是-1,1|r|=1,为为完全相关完全相关r=1,为为完全正相关完全正相关r=-1,为为完全完全负负正相关正相关 r=0,不存在,不存在线线性性相关相关关系关系-1 r0,为负为负相关相关0r 1,为为正相关正相关|r|越越趋趋于于1表表示示关关系系越越强强;|r|越越趋趋于于0表表示示关系越弱关系越弱20.相关系数的性相关系数的性质质性性质质2:r具具有有对对称称性性。即即x与与y之之间间的的相相关关系系数数和和y与与x之之间间的相关系数相等,即的相关系数相等,即rxy=ry性性质质3:r数数值值大大小小与与x和和y原原点点及及尺尺度度无无关关,即即改改变变x和和y的数据原点及的数据原点及计计量尺度,并不改量尺度,并不改变变r数数值值大小大小性性质质4:仅仅仅仅是是x与与y之之间间线线性性关关系系的的一一个个度度量量,它它不不能能用用于于描描述述非非线线性性关关系系。这这意意为为着着,r=0只只表表示示两两个个变变量量之之间间不不存存在在线线性性相相关关关关系系,并并不不说说明明变变量量之之间间没有任何关系没有任何关系性性质质5:r虽虽然然是是两两个个变变量量之之间间线线性性关关系系的的一一个个度度量量,却不一定意味着却不一定意味着x与与y一定有因果关系一定有因果关系21.相关系数的相关系数的经验经验解解释释1.|r|0.8时时,可可视视为为两两个个变变量量之之间间高高度度相相关关2.0.5|r|0.8时时,可,可视为视为中度相关中度相关3.0.3|r|0.5时时,视为视为低度相关低度相关4.|r|t t,拒拒拒拒绝绝绝绝HH0 0 若若若若 t t =7.5344t t(25-2)=2.069(25-2)=2.069,拒拒拒拒绝绝绝绝HH0 0,不不不不良良良良贷贷贷贷款与款与款与款与贷贷贷贷款余款余款余款余额额额额之之之之间间间间存在着存在着存在着存在着显显显显著的正著的正著的正著的正线线线线性相关关系性相关关系性相关关系性相关关系 26.相关系数的相关系数的显显著性著性检验检验(例例题题分析分析)各相关系数各相关系数检验检验的的统计统计量量27.11.2 一元一元线线性回性回归归11.2.1 一元一元线线性回性回归归模型模型11.2.2 参数的最小二乘估参数的最小二乘估计计11.2.3 回回归归直直线线的的拟拟合合优优度度11.2.4 显显著性著性检验检验28.什么是回什么是回归归分析?分析?(Regression)1.从从一一组组样样本本数数据据出出发发,确确定定变变量量之之间间的的数数学学关系式关系式2.对对这这些些关关系系式式的的可可信信程程度度进进行行各各种种统统计计检检验验,并并从从影影响响某某一一特特定定变变量量的的诸诸多多变变量量中中找找出出哪哪些些变变量的影响量的影响显显著,哪些不著,哪些不显显著著3.利利用用所所求求的的关关系系式式,根根据据一一个个或或几几个个变变量量的的取取值值来来预预测测或或控控制制另另一一个个特特定定变变量量的的取取值值,并并给给出出这这种种预测预测或控制的精确程度或控制的精确程度29.回回归归模型的模型的类类型型30.一元一元线线性回性回归归模型模型31.一元一元线线性回性回归归1.涉及一个自涉及一个自变变量的回量的回归归2.因因变变量量y与自与自变变量量x之之间为线间为线性关系性关系被被 预预 测测 或或 被被 解解 释释 的的 变变 量量 称称 为为 因因 变变 量量(dependent variable),用,用y表示表示用用来来预预测测或或用用来来解解释释因因变变量量的的一一个个或或多多个个变变量量称称为为自自变变量量(independent variable),用用x表示表示 3.因因变变量量与与自自变变量量之之间间的的关关系系用用一一个个线线性性方方程来表示程来表示32.回回归归模型模型(regression model)1.回答回答“变变量之量之间间是什么是什么样样的关系?的关系?”2.方程中运用方程中运用1 个数个数值值型因型因变变量量(响响应变应变量量)被被预测预测的的变变量量1 个或多个数个或多个数值值型或分型或分类类型自型自变变量量(解解释变释变量量)用于用于预测预测的的变变量量3.主要用于主要用于预测预测和估和估计计33.一元一元线线性回性回归归模型模型1.描描述述因因变变量量 y 如如何何依依赖赖于于自自变变量量 x 和和误误差差项项 的的方程称方程称为为回回归归模型模型2.一元一元线线性性回回归归模型可表示模型可表示为为 y=+1 1 x +y 是是 x 的的线线性函数性函数(部分部分)加上加上误误差差项项线线性部分反映了由于性部分反映了由于 x 的的变变化而引起的化而引起的 y 的的变变化化误误差差项项 是随机是随机变变量量反反映映了了除除 x 和和 y 之之间间的的线线性性关关系系之之外外的的随随机机因因素素对对 y 的的影响影响是不能由是不能由 x 和和 y 之之间间的的线线性关系所解性关系所解释释的的变变异性异性 0 和和 1 称称为为模型的参数模型的参数34.一元一元线线性回性回归归模型模型(基本假定基本假定)1.因因变变量量x与自与自变变量量y之之间间具有具有线线性关系性关系2.在重复抽在重复抽样样中,自中,自变变量量x的取的取值值是固定的,即假定是固定的,即假定x是是非随机的非随机的3.误误差差项项是一个期望是一个期望值为值为0的随机的随机变变量,即量,即E()=0。对对于一个于一个给给定的定的 x 值值,y 的期望的期望值为值为E(y)=0+1 x4.对对于所有的于所有的 x 值值,的方差的方差2 都相同都相同5.误误差差项项是是一一个个服服从从正正态态分分布布的的随随机机变变量量,且且相相互互独独立立。即即N(0,2)独独立立性性意意味味着着对对于于一一个个特特定定的的 x 值值,它它所所对对应应的的与与其其他他 x 值值所所对应对应的的不相关不相关对对于于一一个个特特定定的的 x 值值,它它所所对对应应的的 y 值值与与其其他他 x 所所对对应应的的 y 值值也不相关也不相关35.一元一元线线性回性回归归模型模型(基本假定基本假定)x x=x x3 3时时的的E E(y y)x x=x x2 2时时y y的分布的分布x x=x x1 1时时y y的分布的分布x x=x x2 2时时的的E E(y y)x x3 3x x2 2x x1 1x x=x x1 1时时的的E E(y y)0 0 xyx x=x x3 3时时y y的分布的分布 0 0+1 1x x36.回回归归方程方程(regression equation)1.描描述述 y 的的平平均均值值或或期期望望值值如如何何依依赖赖于于 x 的的方方程称程称为为回回归归方程方程2.一元一元线线性回性回归归方程的形式如下方程的形式如下3.E(y)=0+1 x方程的方程的方程的方程的图图图图示是一条直示是一条直示是一条直示是一条直线线线线,也称,也称,也称,也称为为为为直直直直线线线线回回回回归归归归方程方程方程方程 0 0是是是是回回回回归归归归直直直直线线线线在在在在 y y 轴轴轴轴上上上上的的的的截截截截距距距距,是是是是当当当当 x x=0=0 时时时时 y y 的的的的期期期期望望望望值值值值 1 1是是是是直直直直线线线线的的的的斜斜斜斜率率率率,称称称称为为为为回回回回归归归归系系系系数数数数,表表表表示示示示当当当当 x x 每每每每变变变变动动动动一个一个一个一个单单单单位位位位时时时时,y y 的平均的平均的平均的平均变动值变动值变动值变动值37.估估计计的回的回归归方程方程(estimated regression equation)3.一元一元一元一元线线线线性回性回性回性回归归归归中估中估中估中估计计计计的回的回的回的回归归归归方程方程方程方程为为为为2.用用用用样样样样本本本本统统统统计计计计量量量量 和和和和 代代代代替替替替回回回回归归归归方方方方程程程程中中中中的的的的未未未未知知知知参参参参数数数数 和和和和 ,就得到了,就得到了,就得到了,就得到了估估估估计计计计的回的回的回的回归归归归方程方程方程方程1.总总总总体体体体回回回回归归归归参参参参数数数数 和和和和 是是是是未未未未知知知知的的的的,必必必必须须须须利利利利用用用用样样样样本本本本数数数数据去估据去估据去估据去估计计计计其其其其中中中中:是是是是估估估估计计计计的的的的回回回回归归归归直直直直线线线线在在在在 y y 轴轴轴轴上上上上的的的的截截截截距距距距,是是是是直直直直线线线线的的的的斜斜斜斜率率率率,它它它它表表表表示示示示对对对对于于于于一一一一个个个个给给给给定定定定的的的的 x x 的的的的值值值值,是是是是 y y 的的的的估估估估计值计值计值计值,也表示,也表示,也表示,也表示 x x 每每每每变动变动变动变动一个一个一个一个单单单单位位位位时时时时,y y 的平均的平均的平均的平均变动值变动值变动值变动值 38.参数的最小二乘估参数的最小二乘估计计39.最小二乘估最小二乘估计计(method of least squares)1.德国科学家德国科学家Karl Gauss(17771855)提出用提出用最小化最小化图图中垂直方向的中垂直方向的误误差平方和来估差平方和来估计计参数参数 2.使因使因变变量的量的观观察察值值与估与估计值计值之之间间的的误误差平方和差平方和达到最小来求得达到最小来求得 和和 的方法。即的方法。即3.用用最最小小二二乘乘法法拟拟合合的的直直线线来来代代表表x与与y之之间间的的关系与关系与实际实际数据的数据的误误差比其他任何直差比其他任何直线线都小都小40.Karl Gauss的最小化的最小化图图x xy y(x xn n,y yn n)(x x1 1,y y1 1)(x x2 2,y y2 2)(x xi i,y yi i)e ei i=y yi i-y yi i41.q相关分析中相关分析中x与与y对对等,回等,回归归分析中分析中x与与y要要确定自确定自变变量和因量和因变变量;量;q相关分析中相关分析中x、y均均为为随机随机变变量,回量,回归归分析分析中只有中只有y为为随机随机变变量;量;q相关分析相关分析测测定相关程度和方向,回定相关程度和方向,回归归分析分析用回用回归归模型模型进进行行预测预测和控制。和控制。回回归归分析与相关分析分析与相关分析区区别别:42.总总体一元体一元线线性回性回归归模型:模型:模型模型参数参数误误差差项项假定:假定:E()=0总总体一元体一元线线性回性回归归方程:方程:43.一元一元线线性回性回归归方程的几何意方程的几何意义义截距截距斜率斜率一元一元线线性回性回归归方程的可能形方程的可能形态态 为为正正 为负为负 为为0回回归归直直线线的的拟拟合合44.总总体一元体一元线线性性回回归归方程方程:样样本一元本一元线线性回性回归归方程:方程:以以样样本本统计统计量估量估计总计总体参数体参数斜率(回斜率(回归归系数)系数)截距截距截距截距a 表示在没有自表示在没有自变变量量x的影响的影响时时,其它各,其它各种因素种因素对对因因变变量量y的平均影响;的平均影响;回回归归系数系数b 表表明自明自变变量量x每每变动变动一个一个单单位,因位,因变变量量y平均平均变变动动b个个单单位。位。(估估计计的回的回归归方程方程)45.随机干随机干扰扰:各种偶然各种偶然因素、因素、观观察察误误差和其差和其他被忽他被忽视视因素的影响因素的影响X对对y的的线线性影响而形性影响而形成的系成的系统统部分,反映部分,反映两两变变量的平均量的平均变动变动关关系,即本系,即本质质特征。特征。46.一元一元线线性回性回归归方程方程中参数中参数a、b的确定的确定:最小平方法最小平方法基本数学要求基本数学要求47.整理得到由两个关于整理得到由两个关于a、b的二元一次的二元一次方程方程组组成的方程成的方程组组:进进一步整理,有:一步整理,有:48.学学生生身高身高x x体重体重y yx x2 2y y2 2xyxy估估计值计值残差残差y-y-A AB BC CD DE EF FG GH HI IJ J158158160160162162164164166166168168170170172172174174176176474750504848555562626060525261617070656524964249642560025600262442624426896268962755627556282242822428900289002958429584302763027630976309762209220925002500230423043025302538443844360036002704270437213721490049004225422574267426800080007776777690209020102921029210080100808840884010492104921218012180114401144047.29147.29149.44849.44851.60651.60653.76453.76455.92155.92158.07958.07960.23660.23662.39462.39464.55264.55266.70966.709-0.291-0.2910.5520.552-3.606-3.6061.2361.2366.0796.0791.9211.921-8.236-8.236-1.394-1.3945.4485.448-1.709-1.709 1670167057057027922027922033032330329554695546-0 049.估估计计方程的求法方程的求法(例例题题分析分析)【例例】求求不不良良贷贷款款对对贷贷款款余余额额的的回回归归方方程程回回归归方程方程为为:y=-0.8295+0.037895 x回回回回归归归归系系系系数数数数 =0.037895=0.037895 表表表表示示示示,贷贷贷贷款款款款余余余余额额额额每每每每增增增增加加加加1 1亿亿亿亿元,不良元,不良元,不良元,不良贷贷贷贷款平均增加款平均增加款平均增加款平均增加0.0378950.037895亿亿亿亿元元元元 50.估估计计方程的求法方程的求法(例例题题分析分析)不良贷款对贷款余额回归方程的图示51.用用Excel进进行回行回归归分析分析第第1步:步:选择选择【工具工具】下拉菜】下拉菜单单第第2步:步:选择选择【数据分析数据分析】选项选项第第3步:在分析工具中步:在分析工具中选择选择【回回归归】,选择选择【确定确定】第第4步:当步:当对话对话框出框出现时现时 在在【Y值值输输入入区区域域】设设置置框框内内键键入入Y的的数数据据区域区域 在在【X值值输输入入区区域域】设设置置框框内内键键入入X的的数数据据区域区域 在在【置信度置信度】选项选项中中给给出所需的数出所需的数值值 在【在【输输出出选项选项】中】中选择输选择输出区域出区域 在【在【残差残差】分析】分析选项选项中中选择选择所需的所需的选项选项52.估估计计方程的求法方程的求法(Excel的的输输出出结结果)果)53.回回归归直直线线的的拟拟合合优优度度54.变变差差1.因因变变量量 y 的的取取值值是是不不同同的的,y 取取值值的的这这种种波波动动称称为为变变差差。变变差来源于两个方面差来源于两个方面由于自由于自变变量量 x 的取的取值值不同造成的不同造成的除除 x 以以外外的的其其他他因因素素(如如x对对y的的非非线线性性影影响响、测测量量误误差等差等)的影响的影响2.对对一一个个具具体体的的观观测测值值来来说说,变变差差的的大大小小可可以以通通过过该该实实际际观观测测值值与与其其均均值值之之差差 来来表示表示55.误误差的分解差的分解(图图示示)x xy yy y56.误误差平方和的分解差平方和的分解(三个平方和的关系三个平方和的关系)SST=SSR+SSE总总总总平方和平方和平方和平方和(SSTSST)回回回回归归归归平方和平方和平方和平方和(SSRSSR)残差平方和残差平方和残差平方和残差平方和(SSESSE)57.误误差平方和的分解差平方和的分解(三个平方和的意三个平方和的意义义)1.总总平方和平方和(SSTtotal sum of squares)反映因反映因变变量的量的 n 个个观观察察值值与其均与其均值值的的总误总误差差2.回回 归归 平平 方方 和和(SSRsum of squares of regression)反反映映自自变变量量 x 的的变变化化对对因因变变量量 y 取取值值变变化化的的影影响响,或或者者说说,是是由由于于 x 与与 y 之之间间的的线线性性关关系系引引起起的的 y 的的取取值变值变化,也称化,也称为为可解可解释释的平方和的平方和3.残差平方和残差平方和(SSEsum of squares of error)反反映映除除 x 以以外外的的其其他他因因素素对对 y 取取值值的的影影响响,也也称称为为不可解不可解释释的平方和或剩余平方和的平方和或剩余平方和58.判定系数判定系数R2(coefficient of determination)1.回回归归平方和平方和占占总误总误差平方和的比例差平方和的比例2.反映回反映回归归直直线线的的拟拟合程度合程度3.取取值值范范围围在在 0,1 之之间间4.R2 1,说说明回明回归归方程方程拟拟合的越好;合的越好;R20,说说明回明回归归方程方程拟拟合的越差合的越差5.判定判定系数等于相关系数的平方,即系数等于相关系数的平方,即R2r259.判定系数判定系数(例例题题分析分析)【例例】计计算算不不良良贷贷款款对对贷贷款款余余额额回回归归的的判判定定系系数数,并并解解释释其意其意义义 判判定定系系数数的的实实际际意意义义是是:在在不不良良贷贷款款取取值值的的变变差差中中,有有71.16%可可以以由由不不良良贷贷款款与与贷贷款款余余额额之之间间的的线线性性关关系系来来解解释释,或或者者说说,在在不不良良贷贷款款取取值值的的变变动动中中,有有71.16%是是由由贷贷款款余余额额所所决决定定的的。也也就就是是说说,不不良良贷贷款款取取值值的的差差异异有有2/3以以上上是是由由贷贷款款余余额额决决定定的的。可可见见不不良良贷贷款与款与贷贷款余款余额额之之间间有有较较强强的的线线性关系性关系 60.估估计标计标准准误误差差(standard error of estimate)1.实际观实际观察察值值与回与回归归估估计值误计值误差平方和的均方根差平方和的均方根2.反映反映实际观实际观察察值值在回在回归归直直线线周周围围的分散状况的分散状况3.对对误误差差项项 的的标标准准差差 的的估估计计,是是在在排排除除了了x对对y的的线线性影响后,性影响后,y随机波随机波动动大小的一个估大小的一个估计计量量4.反反映用估映用估计计的回的回归归方程方程预测预测y时预测误时预测误差的大小差的大小 5.计计算公式算公式为为注:例注:例注:例注:例题题题题的的的的计计计计算算算算结结结结果果果果为为为为1.97991.979961.显显著性著性检验检验62.线线性关系的性关系的检验检验1.检检验验自自变变量量与与因因变变量量之之间间的的线线性性关关系系是是否否显显著著2.将将回回归归均均方方(MSR)同同残残差差均均方方(MSE)加加以以比比较较,应应用用F检检验验来来分分析析二二者者之之间间的的差差别别是是否否显显著著回回归归均均方方:回回归归平平方方和和SSR除除以以相相应应的的自自由由度度(自自变变量的个数量的个数k)残残差差均均方方:残残差差平平方方和和SSE除除以以相相应应的的自自由由度度(n-k-1)63.线线性关系的性关系的检验检验(检验检验的步的步骤骤)1.提出提出假假设设H0:1=0 线线性关系不性关系不显显著著2.计计算算检验统计检验统计量量F3.确定确定显显著性水平著性水平,并根据分子自由度,并根据分子自由度1和分和分母自由度母自由度n-2找出找出临临界界值值F 4.作作出决策:若出决策:若FF ,拒拒绝绝H0;若若FF ,拒拒绝绝H0,线线性关系性关系显显著著65.线线性关系的性关系的检验检验(方差分析表方差分析表)Excel 输输出的方差分析表出的方差分析表66.回回归归系数的系数的检验检验3.在在一一元元线线性性回回归归中中,等等价价于于线线性性关关系系的的显显著著性性检验检验4.采用采用t检验检验1.检检验验 x 与与 y 之之间间是是否否具具有有线线性性关关系系,或或者者说说,检检验验自自变变量量 x 对对因因变变量量 y 的的影影响响是是否否显显著著2.理理论论基基础础是回是回归归系数系数 的抽的抽样样分布分布67.回回归归系数的系数的检验检验(检验检验步步骤骤)1.提出假提出假设设H0:1=0(没有没有线线性关系性关系)H1:1 0(有有线线性关系性关系)2.计计算算检验检验的的统计统计量量3.3.确定确定确定确定显显显显著性水平著性水平著性水平著性水平 ,并,并,并,并进进进进行决策行决策行决策行决策 t t t t,拒拒拒拒绝绝绝绝HH0 0;t t =7.533515t t=2.201=2.201,拒拒拒拒绝绝绝绝HH0 0,表表表表明明明明不不不不良良良良贷贷贷贷款款款款与与与与贷贷贷贷款余款余款余款余额额额额之之之之间间间间有有有有显显显显著的著的著的著的线线线线性关系性关系性关系性关系69.回回归归系数的系数的检验检验(例例题题分析分析)P 值值的的应应用用P P=0.000000=0.000000 =0.05=0.05,拒,拒,拒,拒绝绝绝绝原假原假原假原假设设设设,不良不良不良不良贷贷贷贷款与款与款与款与贷贷贷贷款余款余款余款余额额额额之之之之间间间间有有有有显显显显著的著的著的著的线线线线性关系性关系性关系性关系70.回回归归分析分析结结果的果的评评价价l建建立立的的模模型型是是否否合合适适?或或者者说说,这这个个拟拟合合的的模模型型有有多多“好好”?要回答?要回答这这些些问题问题,可以从以下几个方面入手,可以从以下几个方面入手1.所所估估计计的的回回归归系系数数 的的符符号号是是否否与与理理论论或或事事先先预预期期相相一致一致在在不不良良贷贷款款与与贷贷款款余余额额的的回回归归中中,可可以以预预期期贷贷款款余余额额越越多多,不不良良贷贷款款也也可可能能会会越越多多,也也就就是是说说,回回归归系系数数的的值值应应该该是是正正 的的,在在 上上 面面 建建 立立 的的 回回 归归 方方 程程 中中,我我 们们 得得 到到 的的 回回 归归 系系 数数 为为正正值值,2.如如果果理理论论上上认认为为x与与y之之间间的的关关系系不不仅仅是是正正的的,而而且且是是统计统计上上显显著的,那么所建立的回著的,那么所建立的回归归方程也方程也应该应该如此如此在在不不良良贷贷款款与与贷贷款款余余额额的的回回归归中中,二二者者之之间间为为正正的的线线性性关关系系,而而且且,对对回回归归系系数数的的t检检验验结结果果表表明明而而这这之之间间的的线线性性关系是关系是统计统计上上显显著的著的71.3.回回归归模模型型在在多多大大程程度度上上解解释释了了因因变变量量y取取值值的的差异?可以用判定系数差异?可以用判定系数R2来回答来回答这这一一问题问题在在不不良良贷贷款款与与贷贷款款余余额额的的回回归归中中,得得到到的的R2=71.16%,解解释释了了不不良良贷贷款款变变差差的的2/3以以上上,说说明明拟拟合的效果合的效果还还算不算不错错4.考考察察关关于于误误差差项项 的的正正态态性性假假定定是是否否成成立立。因因为为我我们们在在对对线线性性关关系系进进行行F检检验验和和回回归归系系数数进进行行t检检验验时时,都都要要求求误误差差项项 服服从从正正态态分分布布,否否则则,我我们们所所用用的的检检验验程程序序将将是是无无效效的的。正正态态性性的的简简单单方方法法是是画画出出残残差差的的直直方方图图或或正正态态概概率率图图回回归归分析分析结结果的果的评评价价72.11.3 利用回利用回归归方程方程进进行估行估计计和和预测预测11.3.1 点估点估计计11.3.2 区区间间估估计计73.利用回利用回归归方程方程进进行估行估计计和和预测预测1.根据自根据自变变量量 x 的取的取值值估估计计或或预测预测因因变变量量 y的取的取值值2.估估计计或或预测预测的的类类型型点估点估计计y 的平均的平均值值的点估的点估计计y 的个的个别值别值的点估的点估计计区区间间估估计计y 的平均的平均值值的的置信区置信区间间估估计计y 的个的个别值别值的的预测预测区区间间估估计计74.点估点估计计75.点估点估计计2.点估点估计值计值有有n ny y 的的的的平均平均平均平均值值值值的点估的点估的点估的点估计计计计n ny y 的的的的个个个个别值别值别值别值的点估的点估的点估的点估计计计计3.在点估在点估计计条件下,平均条件下,平均值值的点估的点估计计和个和个别值别值的的的点估的点估计计是一是一样样的,但在区的,但在区间间估估计计中中则则不同不同1.对对于于自自变变量量 x 的的一一个个给给定定值值x0,根根据据回回归归方方程得到因程得到因变变量量 y 的一个估的一个估计值计值76.y 的平均的平均值值的点估的点估计计n利利用用估估计计的的回回归归方方程程,对对于于自自变变量量 x 的的一一个个给给定定值值 x0,求求出出因因变变量量 y 的的平平均均值值的的一个估一个估计值计值E(y0),就是平均就是平均值值的点估的点估计计在在前前面面的的例例子子中中,假假如如我我们们要要估估计计贷贷款款余余额额为为100亿亿元元时时,所所有有分分行行不不良良贷贷款款的的平平均均值值,就就是是平平均均值值的的点点估估计计。根根据据估估计计的的回回归归方方程程得得77.y 的个的个别值别值的点估的点估计计利利用用估估计计的的回回归归方方程程,对对于于自自变变量量 x 的的一一个个给给定定值值 x0,求求出出因因变变量量 y 的的一一个个个个别别值值的估的估计值计值 ,就是个,就是个别值别值的点估的点估计计例例如如,如如果果我我们们只只是是想想知知道道贷贷款款余余额额为为72.8亿亿元元的的那那个个分分行行(这这里里是是编编号号为为10的的那那个个分分行行)的的不不良良贷贷款款是是多多少少,则则属属于于个个别别值值的的点点估估计计。根根据估据估计计的回的回归归方程得方程得78.区区间间估估计计79.区区间间估估计计1.点点估估计计不不能能给给出出估估计计的的精精度度,点点估估计计值值与与实实际际值值之之间间是是有有误误差差的的,因因此此需需要要进进行行区区间间估估计计2.对对于于自自变变量量 x 的的一一个个给给定定值值 x0,根根据据回回归归方程得到因方程得到因变变量量 y 的一个估的一个估计计区区间间3.区区间间估估计计有两种有两种类类型型置置 信信 区区 间间 估估 计计(confidence interval estimate)预预 测测 区区 间间 估估 计计(prediction interval estimate)80.置信区置信区间间估估计计1.利用利用估估计计的回的回归归方程,方程,对对于自于自变变量量 x 的一个的一个给给定定值值 x0,求出因求出因变变量量 y 的的平均平均值值的估的估计计区区间间,这这一估一估计计区区间间称称为为置信区置信区间间(confidence interval)2.E(y0)在在1-置信置信水平下的置信区水平下的置信区间为间为式中:式中:式中:式中:s se e为为为为估估估估计标计标计标计标准准准准误误误误差差差差81.置信区置信区间间估估计计(例例题题分析分析)【例例】求求出出贷贷款款余余额额为为100亿亿元元时时,不不良良贷贷款款95%置信水平下的置信区置信水平下的置信区间间(根据前面(根据前面计计算点估算点估计值计值2.96)解:根据前面的解:根据前面的计计算算结结果,已知果,已知n=25,se=1.9799,t (25-2)=2.069 置信区置信区间为间为当当当当贷贷贷贷款款款款余余余余额额额额为为为为100100亿亿亿亿元元元元时时时时,不不不不良良良良贷贷贷贷款款款款的的的的平平平平均均均均值值值值在在在在2.11412.1141亿亿亿亿元到元到元到元到3.80593.8059亿亿亿亿元之元之元之元之间间间间 82.预测预测区区间间估估计计1.利用估利用估计计的回的回归归方程,方程,对对于自于自变变量量 x 的一个的一个给给定定值值 x0,求出因求出因变变量量 y 的的一个个一个个别值别值的估的估计计区区间间,这这一区一区间间称称为为预测预测区区间间(prediction interval)2.y0在在1-置信水平下的置信水平下的预测预测区区间为间为注意!注意!83.预测预测区区间间估估计计(例例题题分析分析)【例例】求求出出贷贷款款余余额额为为72.8亿亿元元的的那那个个分分行行,不不良良贷贷款款95%的的预测预测区区间间 解:根据前面的解:根据前面的计计算算结结果,已知果,已知n- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第十一 统计学 一元 线性 回归
咨信网温馨提示:
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【快乐****生活】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【快乐****生活】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【快乐****生活】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【快乐****生活】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
关于本文