一元线性回归模型计量经济学.pptx
《一元线性回归模型计量经济学.pptx》由会员分享,可在线阅读,更多相关《一元线性回归模型计量经济学.pptx(56页珍藏版)》请在咨信网上搜索。
在第二章,我们以人为设计的收入在第二章,我们以人为设计的收入与消费数据,讨论了与消费数据,讨论了总体回归模型总体回归模型与与样样本回归模型本回归模型。本章分析。本章分析一元线性回归模一元线性回归模型的经典假定型的经典假定,以及经典假设下的,以及经典假设下的最小最小二乘估计方法二乘估计方法和估计量的统计性质、区和估计量的统计性质、区间估计、假设检验,并运用间估计、假设检验,并运用蒙特卡洛模蒙特卡洛模拟拟直观认识和验证最小二乘估计量的统直观认识和验证最小二乘估计量的统计性质。计性质。回归分析回归分析回归的古典意义古典意义:高尔顿遗传学的回归概念高尔顿遗传学的回归概念(父母身高与子女身高的关系父母身高与子女身高的关系)子女的身高有向人的平均身高子女的身高有向人的平均身高 回归回归 的趋势的趋势回归的现代意义现代意义:一个被解释变量对若干个一个被解释变量对若干个解释变量依存关系的研究解释变量依存关系的研究回归的目的目的(实质实质):由解释变量去估计被解释变由解释变量去估计被解释变量的平均值量的平均值 被解释变量被解释变量Y Y的的条件分布和条件概率条件分布和条件概率:当当解解释释变变量量X X取取某某固固定定值值时时(条条件件),Y Y 的的值值不不确确定定,Y Y的的不不同同取取值值会会形形成成一一定定的的分分布布,这这是是 Y Y 的的条条件件分分布布。X X取某固定值时,取某固定值时,Y Y 取不同值的概率称为取不同值的概率称为条件概率条件概率。被解释变量被解释变量 Y Y 的的条件期望条件期望:对于对于 X X 的每一个取值,的每一个取值,对对 Y Y 所形成的分布确所形成的分布确 定其期望或均值,称定其期望或均值,称 为为 Y Y 的的条件期望或条件均条件期望或条件均 值值,用,用 表示。表示。注意注意:Y:Y的条件期望是随的条件期望是随X X的变动而变动的的变动而变动的 YX明确几个概念明确几个概念(为深刻理解“回归”)4回归线回归线:对于每一个:对于每一个X的取值的取值 ,都有,都有Y的条件期望的条件期望 与与之之对对应应,代代表表Y的的条条件件期期望望的的点点的的轨轨迹迹形形成成的直线或曲线称为回归线。的直线或曲线称为回归线。回归函数回归函数:被解释变量:被解释变量Y的条件期望的条件期望 随随解释变量解释变量X的变化而有规律的变化而有规律的变化,如果把的变化,如果把Y的条件期的条件期望表现为望表现为 X 的某种函数的某种函数 ,这个函数称为回归函数。这个函数称为回归函数。回归函数分为:总体回归函数和样本回归函数回归函数分为:总体回归函数和样本回归函数 X Y5 1 1、总体回归函数的概念总体回归函数的概念 前提:前提:假如已知假如已知所研究的经济现象的总体的被解释变量所研究的经济现象的总体的被解释变量Y和解释变量和解释变量X的每个观测值的每个观测值(通常这是不可能的!)(通常这是不可能的!),那,那么,可以计算出总体被解释变量么,可以计算出总体被解释变量Y的条件期望的条件期望 ,并将其表现为解释变量并将其表现为解释变量X的某种函数的某种函数 这个函数称为这个函数称为总体回归函数(总体回归函数(PRF)本质本质:总体回归函数实际上表现的是特定总体中被解释变总体回归函数实际上表现的是特定总体中被解释变量随解释变量的变动而变动的某种规律性。量随解释变量的变动而变动的某种规律性。计量经济学的根本目的是要探寻变量间数量关系的规律计量经济学的根本目的是要探寻变量间数量关系的规律,也也就要努力去寻求总体回归函数就要努力去寻求总体回归函数。6 条件期望条件期望表现形式表现形式例如例如Y的条件期望的条件期望 是解是解释变量释变量X的线性函数,可表示为:的线性函数,可表示为:个别值个别值表现形式表现形式(随机设定形式)(随机设定形式)对于一定的对于一定的 ,Y的各个别值的各个别值 并不一定等于条件期望,而并不一定等于条件期望,而是分布在是分布在 的周围,若令各个的周围,若令各个 与条件期望与条件期望 的的偏差为偏差为 ,显然,显然 是个随机变量,则有是个随机变量,则有 2.2.总体回归函数的表现形式总体回归函数的表现形式PRF作作为为总总体体运运行行的的客客观观规规律律,总总体体回回归归函函数数是是客客观观存存在在的的,但但在在实实际际的的经经济济研研究究中中总总体体回回归归函函数数通通常常是是未未知知的的,只只能能根根据据经经济济理理论论和和实实践践经经验验去去设设定定。计计量量经经济济学学研研究究中中“计计量量”的的根根本本目目的的就就是是要要寻寻求求总总体体回归函数。回归函数。我我们们所所设设定定的的计计量量模模型型实实际际就就是是在在设设定定总总体体回回归归函函数数的具体形式。的具体形式。总总体体回回归归函函数数中中 Y Y 与与 X X 的的关关系系可可以以是是线线性性的的,也也可可以是以是非线性非线性的。的。73 3、如何理解总体回归函数、如何理解总体回归函数概念概念在总体回归函数中,各个在总体回归函数中,各个的值与其条件期望的值与其条件期望的偏差的偏差有很重有很重要的意义。若只有要的意义。若只有的影响的影响,与与不应有偏差。若偏不应有偏差。若偏差差存在,说明还有其他影响因素。存在,说明还有其他影响因素。实际代表了排除在模型以外的所有因素对实际代表了排除在模型以外的所有因素对Y的影响。的影响。性质:性质:是期望为是期望为0有一定分布的随机变量。有一定分布的随机变量。重重要要性性:随随机机扰扰动动项项的的性性质质决决定定着着计计量量经经济济分分析析结结果果的的性性质质和和计计量经济方法的选择。量经济方法的选择。1、随机扰动项、随机扰动项 是是未知影响因素未知影响因素的代表的代表(理论的模糊性理论的模糊性)是是无无法法取取得得数数据据的的已已知知影影响响因因素素的的代代表表(数数据据欠欠缺缺)是是众多细小影响因素众多细小影响因素的综合代表的综合代表(非系统性影响非系统性影响)模型可能存在模型可能存在设定误差设定误差(变量、函数形式的设定)变量、函数形式的设定)模模型型中中变变量量可可能能存存在在观观测测误误差差(变变量量数数据据不不符符合合实实际际)变变量量可可能能有有内内在在随随机机性性(人人类类经经济济行行为为的的内内在在随随机机性性)92、引入随机扰动项、引入随机扰动项 的原因的原因样本回归线:样本回归线:对对于于X的的一一定定值值,取取得得Y的的样样本本观观测测值值,可可计计算算其其条条件件均值,样本观测值条件均值的轨迹,称为样本回归线。均值,样本观测值条件均值的轨迹,称为样本回归线。样本回归函数:样本回归函数:如果把被解释变量如果把被解释变量Y的样本条件的样本条件均值表示为解释变量均值表示为解释变量X的某种函的某种函数,这个函数称为样本回归函数,这个函数称为样本回归函数(数(SRF)。)。10XYSRF1、样本回归函数、样本回归函数(SRF)11样本回归函数如果为线性函数,可表示为样本回归函数如果为线性函数,可表示为其中:其中:是与是与相对应的相对应的Y的样本条件均值的样本条件均值和和分别是样本回归函数的参数分别是样本回归函数的参数个别值(实际值)形式:个别值(实际值)形式:被被解解释释变变量量Y的的实实际际观观测测值值不不完完全全等等于于样样本本条条件件均均值值,二二者之差用者之差用表示,表示,称为称为剩余项剩余项或或残差项残差项:则则或或2、样本回归函数的函数形式、样本回归函数的函数形式条件均值形式:条件均值形式:样样本本回回归归线线随随抽抽样样波波动动而而变变化化:每每次次抽抽样样都都能能获获得得一一个个样样本本,就可以拟合一条样本回归线就可以拟合一条样本回归线(SRF不唯一不唯一)。样本回归函数的函数形式样本回归函数的函数形式应与设定的总体回归函数的应与设定的总体回归函数的函数形式一致。函数形式一致。样本回归线只是样本条件均样本回归线只是样本条件均值的轨迹,还不是总体回归值的轨迹,还不是总体回归线,它至多只是未知的总体线,它至多只是未知的总体回归线的近似表现。回归线的近似表现。123、样本回归函数、样本回归函数的特点的特点SRF1SRF2 YX AX13PRFSRF4、样本回归函数与总体回归函数的关系、样本回归函数与总体回归函数的关系如果能够通过某种方式获得如果能够通过某种方式获得和和的数值,显然的数值,显然:和和是对总体回归函数参数是对总体回归函数参数和和的估计的估计是对总体条件期望是对总体条件期望的估计的估计在概念上类似总体回归函数中的在概念上类似总体回归函数中的,可视,可视为对为对的估计。的估计。14对比:对比:总体回归函数总体回归函数 样本回归函数样本回归函数4、对样本回归的理解、对样本回归的理解第三章第三章一元线性回归模型一元线性回归模型3.43.4例子:中国消费函数例子:中国消费函数3.53.5 对最小二乘估计量统计性质的直观认识对最小二乘估计量统计性质的直观认识-蒙特卡洛模拟蒙特卡洛模拟3.3回归参数的区间估计和假设检验回归参数的区间估计和假设检验3.2拟合优度拟合优度3.1一元线性回归模型参数的估计一元线性回归模型参数的估计本章小结本章小结3.1一元线性回归模型参数的估计一元线性回归模型参数的估计一元线性回归模型是指模型中只有一个解释变量的模型,也称为简单一元线性回归模型是指模型中只有一个解释变量的模型,也称为简单线性回归模型,其一般形式是:线性回归模型,其一般形式是:(3.1.1)Y为被解释变量,为被解释变量,X为解释变量。因为模型中共有两个变量,所以,模为解释变量。因为模型中共有两个变量,所以,模型(型(3.1.1)也被称为双变量线性回归模型,)也被称为双变量线性回归模型,0与与1为待估参数,为待估参数,ui为随机为随机误差项或随机扰动项。误差项或随机扰动项。一、基本假定一、基本假定1、对模型与变量的假定、对模型与变量的假定假定假定1:回归模型对参数(系数):回归模型对参数(系数)而言是线性模型。而言是线性模型。所谓线性回归模型是指关于参数是线所谓线性回归模型是指关于参数是线性的模型。无论关于变量是线性还是非线性的模型。无论关于变量是线性还是非线性的模型,只要它关于参数(系数)是线性的模型,只要它关于参数(系数)是线性模型,都称为线性回归模型。比如:性模型,都称为线性回归模型。比如:(1)(1)变量、参数均为变量、参数均为“线性线性”,这是线,这是线性回归模型;性回归模型;(2)(2)参数参数“线性线性”,变量,变量“非线性非线性”,这也是线性回归模型;这也是线性回归模型;(3)(3)变量变量“线性线性”,参数,参数“非线性非线性”,这就是一个非线性回归模型。这就是一个非线性回归模型。(2)(3)(1)假定假定2:解释变量:解释变量X是外生变量。即在是外生变量。即在重复抽样中,重复抽样中,X取固定不变的值。这一取固定不变的值。这一假定意味着回归分析是条件回归分析,假定意味着回归分析是条件回归分析,就是以解释变量就是以解释变量X的给定值作为条件的。的给定值作为条件的。根据这一假定,有解释变量根据这一假定,有解释变量X与随机扰与随机扰动项动项ui不相关,即:不相关,即:假定假定3:模型是正确设定的。:模型是正确设定的。i=1,2,N 以上这些对随机扰以上这些对随机扰动项的假定是由德国数动项的假定是由德国数学家高斯(学家高斯(GaussGauss)最)最早提出的,也称为线性早提出的,也称为线性回归模型的经典假定或回归模型的经典假定或高斯假定,满足上述假高斯假定,满足上述假定的线性回归模型,称定的线性回归模型,称为经典线性回归模型为经典线性回归模型一、基本假定一、基本假定2、对随机扰动项的假定、对随机扰动项的假定假定假定4:零均值假定。即在给定解释变:零均值假定。即在给定解释变量的条件下,随机扰动项的条件均值为零。量的条件下,随机扰动项的条件均值为零。i=1,2,N假定假定6:无自相关假定。:无自相关假定。假定假定5:同方差假定。在给定:同方差假定。在给定X的条件下,的条件下,ui的条件方差为某个常数的条件方差为某个常数i=1,2,NX Y19二、普通最小二乘法(二、普通最小二乘法(OLSOLS)Y Yi i的变化可以分为两部分,一部分是可以由的变化可以分为两部分,一部分是可以由X Xi i的变化解释的,的变化解释的,另一部分来自随机扰动。另一部分来自随机扰动。Y Yi i向向X Xi i所解释的所解释的“平均水平平均水平”回归,这回归,这就是就是“回归回归”的含义。而斜率系数的含义。而斜率系数1 1是指,是指,X Xi i每变化一个单位,每变化一个单位,Y Yi i平均变化平均变化1 1个单位。个单位。0 0是样本回归直线的截距。是样本回归直线的截距。基于假定基于假定3 3,我们对模型(,我们对模型(3.1.13.1.1)取条件期望,则有:)取条件期望,则有:(3.1.63.1.6)即:即:第一步构造含有待估计系数的残差平方和并对其求最小第二步对残差平方和求两个系数的偏导数(一阶条件)对第二步的进一步演算对第二步的进一步演算 在(在(3.1.9)式中,令)式中,令 ,xi和和yi分别称为分别称为Xi和和Yi的离差形的离差形式,也可称为对式,也可称为对Xi和和Yi的中心化处理。为方便,我们的中心化处理。为方便,我们 以下分析过程中,将和以下分析过程中,将和号简写。容易证明:号简写。容易证明:(3.1.10)(3.1.11)于是,估计量(于是,估计量(3.1.9)可以表示为离差形式:)可以表示为离差形式:(3.1.12)在计量经济学中,往往以小写字母表示对均值的离差。由于在计量经济学中,往往以小写字母表示对均值的离差。由于和和是是从最小二乘原理推导出来的,故称为普通最小二乘估计量。将样本数据代入从最小二乘原理推导出来的,故称为普通最小二乘估计量。将样本数据代入估计量的计算公式(估计量的计算公式(3.1.12)即可求得参数的估计值。)即可求得参数的估计值。例3.1.1题目表表3.1.1 20083.1.1 2008年中国各地区城市居民人均年消费支出和可支配收入年中国各地区城市居民人均年消费支出和可支配收入数据来源:中国统计年鉴数据来源:中国统计年鉴20092009请回答:我国宏观经济中的边际消费倾向是多少?地区城市居民家庭平均每人每年消费支出(元)城市居民人均年可支配收入(元)地区城市居民家庭平均每人每年消费支出(元)城市居民人均年可支配收入(元)北京16460.2624724.89湖北9477.5113152.86天津13422.4719422.53湖南9945.5213821.16河北9086.7313441.09广东15527.9719732.86山西8806.5513119.05广西9627.414146.04内蒙古10828.6214432.55海南9408.4812607.84辽宁11231.4814392.69重庆11146.814367.55吉林9729.0512829.45四川9679.1412633.38黑龙江8622.9711581.28贵州8349.2111758.76上海19397.8926674.9云南9076.6113250.22江苏11977.5518679.52西藏8323.5412481.51浙江15158.322726.66陕西9772.0712857.89安徽9524.0412990.35甘肃8308.6210969.41福建12501.1217961.45青海8192.5611640.43江西8717.3712866.44宁夏9558.2912931.53山东11006.6116305.41新疆8669.3611432.1河南8837.4613231.11例3.1.1解答 我我们设定样本回归模型们设定样本回归模型 其其中中Yi为为城市居民家庭平均每人每年消费支出;城市居民家庭平均每人每年消费支出;Xi为为城市居民城市居民人均年可支配收入人均年可支配收入。使用这组样本数据,对。使用这组样本数据,对(3.1.13)做最小做最小二乘估计,结果为二乘估计,结果为 从样本回归函数可知,边际消费倾向从样本回归函数可知,边际消费倾向 ,也就是也就是说收入每增加说收入每增加1元,消费平均增加元,消费平均增加0.6647元。元。(3.1.13)(3.1.14)例3.1.1思考图图3.1.1 3.1.1 样本数据的散点图和样本回归直线样本数据的散点图和样本回归直线样本点紧密散布在样本回归直线周围,有的样本点样本点紧密散布在样本回归直线周围,有的样本点落在样本回归直线上,但是大多数样本点不在样本回归落在样本回归直线上,但是大多数样本点不在样本回归直线上,而是在直线上方或者下方,那么这条样本回归直线上,而是在直线上方或者下方,那么这条样本回归直线直线“逼近逼近”了总体回归直线吗?为什么要用普通最小了总体回归直线吗?为什么要用普通最小二乘法?如何度量样本回归模型对样本观测值的拟合程二乘法?如何度量样本回归模型对样本观测值的拟合程度度?要回答这些问题,我们必须学习估计量的统计性质和要回答这些问题,我们必须学习估计量的统计性质和模型的拟合优度等概念。模型的拟合优度等概念。25三、最小二乘估计量的统计性质三、最小二乘估计量的统计性质参数估计量的主要性质参数估计量的主要性质无偏性无偏性有效性有效性线性性线性性即估计量是随机样本数据的线性函数;即估计量是随机样本数据的线性函数;即估计量的期望等于总体的真实值,即估计量的期望等于总体的真实值,即:即:即估计量即估计量在所有线性无偏估计量在所有线性无偏估计量中具有最小方差,也称为最小方中具有最小方差,也称为最小方差性,即:差性,即:最优最优线性线性无偏无偏估计估计量量估计估计量的量的有限有限样本样本性质性质26三、最小二乘估计量的统计性质三、最小二乘估计量的统计性质参数估计量的主要性质参数估计量的主要性质渐近无偏性渐近无偏性渐近有效性渐近有效性一致性一致性即样本容量趋于无穷大时,估计量的即样本容量趋于无穷大时,估计量的期望趋于总体真实值,即:期望趋于总体真实值,即:即样本容量趋于无穷大时,估计量依即样本容量趋于无穷大时,估计量依概率收剑于总体的真实值,即:概率收剑于总体的真实值,即:其中:符号其中:符号“Plim”表示概率极限,因表示概率极限,因为随机变量没有极限值,只能求概率为随机变量没有极限值,只能求概率极限。极限。即样本容量趋于无穷大时,估计量即样本容量趋于无穷大时,估计量在所有的一致估计量在所有的一致估计量中具有最小中具有最小的渐近方差,即:的渐近方差,即:估计估计量的量的大样大样本性本性质或质或渐近渐近性质性质高斯高斯-马尔可夫定理马尔可夫定理 由以上分析可以看出,普通最小二乘估计量(由以上分析可以看出,普通最小二乘估计量(ordinaryleastsquaresestimators)在经典假定下具有线性性、无偏性)在经典假定下具有线性性、无偏性和最小方差性等性质,称具有这些性质的估计量为最优线性无偏和最小方差性等性质,称具有这些性质的估计量为最优线性无偏估计量(估计量(bestlinearunbiasedestimator,BLUE)。)。高斯高斯-马尔可夫定理(马尔可夫定理(Gauss-Markovtheorem)在经典假定下,普通最小二乘估计量具有线性性、无偏性和在经典假定下,普通最小二乘估计量具有线性性、无偏性和最小方差性(最小方差性(BLUE)。3.2拟合优度拟合优度 如图如图3.2.13.2.1(a a)和()和(b b)中的直线,它们分别表示由散点表示的样)中的直线,它们分别表示由散点表示的样本数据所对应的样本回归直线(本数据所对应的样本回归直线(OLS估计的样本回归直线),它们都是估计的样本回归直线),它们都是通过残差平方和最小而产生的直线,但是二者对样本观测值的拟合程度通过残差平方和最小而产生的直线,但是二者对样本观测值的拟合程度显然是不同的。这两条直线,谁拟合得更好?这就需要使用拟合优度的显然是不同的。这两条直线,谁拟合得更好?这就需要使用拟合优度的概念。概念。3.2.13.2.1一、总离差平方和的分解一、总离差平方和的分解 已知由一组样本观测值已知由一组样本观测值 得到如下样本回归直线:得到如下样本回归直线:Y的第的第 个观测值与样本均值的离差个观测值与样本均值的离差 可分解为两部分之和可分解为两部分之和(3.2.1)(3.2.2)图图3.2.2 总离差的分解示意图总离差的分解示意图RSS称为残差平方和(称为残差平方和(residual sum of squares,RSS),反映样本观测值),反映样本观测值与估计值偏离的大小,也是模型中解释变量未解释的离差。与估计值偏离的大小,也是模型中解释变量未解释的离差。(3.2.7)(3.2.6)ESS称为回归平方和(称为回归平方和(explainedsumofsquares,ESS),反映由模),反映由模型中解释变量所解释的那部分离差的大小。型中解释变量所解释的那部分离差的大小。TSS称为总平方和(称为总平方和(totalsumofsquares,TSS),它反映样本观测值),它反映样本观测值总体离差的大小。总体离差的大小。对于所有样本点,由于对于所有样本点,由于 可以证明可以证明 ,所以有,所以有 (3.2.3)(3.2.5)(3.2.4)二、二、拟合优度ESS占占Y的总离差平方和的比例的总离差平方和的比例,度量了回归直线对样本观测值的拟合优度量了回归直线对样本观测值的拟合优度。这一比例记为度。这一比例记为R2,被称为,被称为判定系数判定系数。(3.2.8)如果样本回归直线与样本观测值完全拟合,或者说,所有的样本点如果样本回归直线与样本观测值完全拟合,或者说,所有的样本点全部落在样本回归直线上,则有全部落在样本回归直线上,则有R2=1。但是,由于样本的随机性,样本。但是,由于样本的随机性,样本回归直线(或者估计的模型)与样本观测值完全拟合,亦即回归直线(或者估计的模型)与样本观测值完全拟合,亦即R2=1的情况的情况很少发生。很少发生。R2越大,说明在总变差中由回归解释的部分所占比重越大,越大,说明在总变差中由回归解释的部分所占比重越大,拟合优度越高。反之,拟合优度越高。反之,R2越小,说明估计的模型对样本观测值的拟合程越小,说明估计的模型对样本观测值的拟合程度越差。度越差。3.3回归参数的区间估计和假设检验回归参数的区间估计和假设检验一、回归参数估计量的概率分布一、回归参数估计量的概率分布的概率分布的概率分布 在在ui服从正态分布的假设下,即:服从正态分布的假设下,即:ui N(0,(0,2 2)则则Yi服从正态分布,所以服从正态分布,所以 也服从正也服从正态分布,其分布特征由其均值和方差唯一决定,态分布,其分布特征由其均值和方差唯一决定,即即(3.3.2)(3.3.1)3.3回归参数的区间估计和假设检验回归参数的区间估计和假设检验一、回归参数估计量的概率分布一、回归参数估计量的概率分布的标准差的标准差于是,于是,的标准差分别为的标准差分别为(3.3.3)(3.3.4)3.3回归参数的区间估计和假设检验回归参数的区间估计和假设检验一、回归参数估计量的概率分布一、回归参数估计量的概率分布的标准化变换的标准化变换(3.3.6)(3.3.5)若将正态随机变量若将正态随机变量做标准化变换做标准化变换即经过标准化变换的即经过标准化变换的均服从标准正均服从标准正态分布。态分布。3.3回归参数的区间估计和假设检验回归参数的区间估计和假设检验一、回归参数估计量的概率分布一、回归参数估计量的概率分布的标准误的标准误我们定义:我们定义:用用代替代替的标准差中的的标准差中的2,得到估得到估计量的标准差的估计,为区别起见,称为标准计量的标准差的估计,为区别起见,称为标准误:误:可以证明,用标准误对可以证明,用标准误对作标准化变作标准化变换,所得到的换,所得到的和和已经不再服从已经不再服从,而是服从,而是服从,即,即(3.3.8)(3.3.10)(3.3.11)(3.3.7)(3.3.9)二、回归参数的区间估计二、回归参数的区间估计参数估计中的区间估计参数估计中的区间估计 选择一个显著性水平选择一个显著性水平(0 1),并求一个正,并求一个正数数,使得随机区间,使得随机区间()包含参数包含参数 (真(真实值)的概率为实值)的概率为1-,即,即 其中,其中,1-称为称为置信系数(置信度、置信水平)置信系数(置信度、置信水平),称为称为显著性水平显著性水平,而,而()称为称为具有置具有置信水平信水平 1-的置信区间的置信区间,也就是说,我们有,也就是说,我们有 1-的的“把握把握”认为,置信区间覆盖了真值认为,置信区间覆盖了真值 。这个区。这个区间也称为间也称为 的的区间估计区间估计。置信区间的两个端点称。置信区间的两个端点称为为置信上限置信上限和和置信下限置信下限。二、回归参数的区间估计二、回归参数的区间估计具体构造参数的区间估计具体构造参数的区间估计 给定置信度给定置信度1-1-,从,从t t 分布表中查得自由分布表中查得自由度为度为 的临界值的临界值 ,那么,那么t t 值处在(值处在(-,)内的概率是)内的概率是 1-1-(图(图3.3.13.3.1的中间空白区域面的中间空白区域面积),即积),即 整理(整理(3.3.143.3.14)式得)式得 于是得到于是得到 的置信度为的置信度为1-1-的置信区间的置信区间(3.3.13)(3.3.15)(3.3.16)(3.3.14)图图3.3.1 t分布的分布的1-置信区间置信区间三、变量的显著性检验:三、变量的显著性检验:t 检验检验为检验收入(为检验收入(X)是否显著地解释了消费()是否显著地解释了消费(Y)的平均变化,设定假设检验的)的平均变化,设定假设检验的原假设原假设(虚拟假设)(虚拟假设)和和备择假设(对立假设)备择假设(对立假设)分别是分别是:,:如果收入(如果收入(X)显著地解释了消费()显著地解释了消费(Y)的平均变化,那么参数)的平均变化,那么参数的估计值应该显著的估计值应该显著不为不为0,也就是说,我们应该以某种显著性水平拒绝原假设,也就是说,我们应该以某种显著性水平拒绝原假设。由(由(3.3.11)式我们已经知道,在随机误差项的正态性假定下,有)式我们已经知道,在随机误差项的正态性假定下,有将原假设代入以上的将原假设代入以上的t 统计量中,有统计量中,有给定一个显著性水平给定一个显著性水平=0.05,在在 t 分布表中可以查到一个对应的临界值分布表中可以查到一个对应的临界值,于,于是,是,所界定的区间为所界定的区间为接受域接受域(严格意义上应该称为(严格意义上应该称为不拒绝域不拒绝域),而),而称为称为拒绝域拒绝域。同理,如果原假设和备选假设分别是同理,如果原假设和备选假设分别是:,:将原假设代入(将原假设代入(3.3.10)中,有)中,有图图3.3.2t检验法和检验法和p值检验法等价示意图值检验法等价示意图-双侧检验双侧检验(3.3.17)(3.3.18)四、检验统计量的四、检验统计量的p 值值 对回归参数的假设检验是在给定的显著性水平下做出的,因此当给定的显对回归参数的假设检验是在给定的显著性水平下做出的,因此当给定的显著性水平不同时,检验所得的结论很可能不同,甚至会产生相反的结论。在原著性水平不同时,检验所得的结论很可能不同,甚至会产生相反的结论。在原假设既定、假设既定、t 统计量已确定的情况下,对参数假设检验的结论与显著性水平息息统计量已确定的情况下,对参数假设检验的结论与显著性水平息息相关。如何避免选择相关。如何避免选择 的主观性的主观性?一个简单的方法是,在既定原假设下,计算一个简单的方法是,在既定原假设下,计算t统计量的值,记为统计量的值,记为 ,在,在t分布表中可以查到分布表中可以查到 所对应的双尾(在概率趋所对应的双尾(在概率趋于于0的方向)的概率值,这个概率值即为的方向)的概率值,这个概率值即为t统计量的值等于统计量的值等于 时的时的p值。值。p值参值参看图看图3.3.2,用公式表示,即为,用公式表示,即为 使用这个使用这个p值就勿需人为地选择显著性水平,即可方便的做出拒绝或者不拒绝值就勿需人为地选择显著性水平,即可方便的做出拒绝或者不拒绝原假设的结论。原假设的结论。当原假设不是等于某个值,而是大于等于或者小于等于某个值时,就要使当原假设不是等于某个值,而是大于等于或者小于等于某个值时,就要使用单侧检验,包括:(用单侧检验,包括:(1)左侧检验:)左侧检验:,:,。此时临界值。此时临界值是是 ,拒绝域是,拒绝域是 。或者使用。或者使用p值产生检验结论,见图值产生检验结论,见图3.3.3;(2)右侧检验:)右侧检验:,:,。此时临界值是。此时临界值是 ,拒绝域是,拒绝域是 。或者用。或者用p值做出拒绝或者不拒绝原假设的结论,见图值做出拒绝或者不拒绝原假设的结论,见图3.3.4。图图3.3.4 3.3.4 t t检验法和检验法和p p值检验法等价示意图值检验法等价示意图-右侧检验右侧检验图图3.3.3 3.3.3 t t检验法和检验法和p p值检验法等价示意图值检验法等价示意图-左侧检验左侧检验单侧检验单侧检验3.4例子:中国消费函数例子:中国消费函数表表3.1.1 20083.1.1 2008年中国各地区城市居民人均年消费支出和可支配收入年中国各地区城市居民人均年消费支出和可支配收入数据来源:中国统计年鉴数据来源:中国统计年鉴20092009地区城市居民家庭平均每人每年消费支出(元)城市居民人均年可支配收入(元)地区城市居民家庭平均每人每年消费支出(元)城市居民人均年可支配收入(元)北京16460.2624724.89湖北9477.5113152.86天津13422.4719422.53湖南9945.5213821.16河北9086.7313441.09广东15527.9719732.86山西8806.5513119.05广西9627.414146.04内蒙古10828.6214432.55海南9408.4812607.84辽宁11231.4814392.69重庆11146.814367.55吉林9729.0512829.45四川9679.1412633.38黑龙江8622.9711581.28贵州8349.2111758.76上海19397.8926674.9云南9076.6113250.22江苏11977.5518679.52西藏8323.5412481.51浙江15158.322726.66陕西9772.0712857.89安徽9524.0412990.35甘肃8308.6210969.41福建12501.1217961.45青海8192.5611640.43江西8717.3712866.44宁夏9558.2912931.53山东11006.6116305.41新疆8669.3611432.1河南8837.4613231.11 数数 据据3.4例子:中国消费函数例子:中国消费函数模型估计模型估计 根据凯恩斯消费理论根据凯恩斯消费理论,对于表对于表3.1.1中的消费和收入的数中的消费和收入的数据,回归模型设定为:据,回归模型设定为:Y城市居民家庭平均每人每年消费支出城市居民家庭平均每人每年消费支出(元元)X城市居民人均年可支配收入城市居民人均年可支配收入(元元)基于表基于表3.1.1的数据,的数据,运用运用OLS估计结果如下估计结果如下:其中,第一行是估计的其中,第一行是估计的回归方程回归方程,第二行是对应估计量,第二行是对应估计量的的标准误标准误,第三行是对应参数在原假设下的,第三行是对应参数在原假设下的t值值,最后一行,最后一行是是拟合优度拟合优度。(3.4.1)(3.4.2)3.4例子:中国消费函数例子:中国消费函数估计检验估计检验与与经济解释经济解释 从估计的结果看从估计的结果看,估计的斜率系数为估计的斜率系数为 0.6647,说明城镇居民人均,说明城镇居民人均可支配收入每增加可支配收入每增加 1元,人均消费支出平均增加元,人均消费支出平均增加 0.6647元,即元,即边际消边际消费倾向费倾向的估计值的估计值 ,这一结果不仅符合经济理论中关于对,这一结果不仅符合经济理论中关于对边际消费倾向的假定,同时也说明,如果提高收入水平,能比较明边际消费倾向的假定,同时也说明,如果提高收入水平,能比较明显的扩大消费。估计的截距为显的扩大消费。估计的截距为 725.3459,可以认为是,可以认为是自主性消费支自主性消费支出出,即当收入为零的时候还存在的消费。但是,在计量经济学中,即当收入为零的时候还存在的消费。但是,在计量经济学中,一般对截距不做解释,因为解释变量为一般对截距不做解释,因为解释变量为 0几乎没有经济学意义。以上几乎没有经济学意义。以上对估计结果的分析表明,估计结果不仅与相关经济理论一致,也体对估计结果的分析表明,估计结果不仅与相关经济理论一致,也体现了比较明显的现实经济意义。现了比较明显的现实经济意义。由(由(3.3.19)式和()式和(3.3.20)式可知)式可知 的的 t值为值为 22.496,的的 t值值为为 1.589,给定显著性水平,给定显著性水平 ,查表得临界值为,查表得临界值为 。由。由 ,拒绝原假设,说明斜,拒绝原假设,说明斜率率 在在 5%的显著性水平下显著不为的显著性水平下显著不为 0,这表明,可支配收入对消费,这表明,可支配收入对消费有显著影响。而有显著影响。而 ,不能拒绝截距为零的原假设。,不能拒绝截距为零的原假设。等价地,等价地,p值分别为值分别为 0.0000和和 0.1229分别小于和大于分别小于和大于 0.05,结论和,结论和 t值检验一样。值检验一样。拟合优度为拟合优度为 =0.946,说明模型整体上对样本数据拟合较好,说明模型整体上对样本数据拟合较好,即解释变量即解释变量“城市居民人均年可支配收入城市居民人均年可支配收入”解释了被解释变量解释了被解释变量“城城市居民人均年消费支出市居民人均年消费支出”的平均变化的的平均变化的 94.6%。我国居民消费主要取决于居民可支配收入。但我国我国居民消费主要取决于居民可支配收入。但我国个人收入在国民收入的初次分配个人收入在国民收入的初次分配(在初次分配中,国民收在初次分配中,国民收入被分解为三个基本的部分:国家收入、企业收入、个入被分解为三个基本的部分:国家收入、企业收入、个人收入人收入)中的占比长期偏低。因此提高消费的关键在于收中的占比长期偏低。因此提高消费的关键在于收入分配的改革。基于边际消费倾向的估计值,就可以得入分配的改革。基于边际消费倾向的估计值,就可以得到相关乘数,由到相关乘数,由 ,投资乘数投资乘数 ,表示当投资增加,表示当投资增加1个单位时,将导致总产出平均增加个单位时,将导致总产出平均增加 2.982个单位。以上的个单位。以上的分析为制定收入分配改革的政策和制定投资规模提供了分析为制定收入分配改革的政策和制定投资规模提供了重要的信息。重要的信息。政策分析与评价政策分析与评价模型应用模型应用3.5对最小二乘估计量统计性质的直观认识对最小二乘估计量统计性质的直观认识蒙特卡洛模拟蒙特卡洛模拟 由前述,在一元线性回归模型中,满足经典假设的最小由前述,在一元线性回归模型中,满足经典假设的最小二乘估计量,具有无偏性,最小方差性,随机误差项服从正二乘估计量,具有无偏性,最小方差性,随机误差项服从正态分布的假定下,估计量也服从正态分布。本节我们设计一态分布的假定下,估计量也服从正态分布。本节我们设计一个简单的蒙特卡洛仿真实验,以验证个简单的蒙特卡洛仿真实验,以验证OLSOLS估计量的统计性质。估计量的统计性质。具体步骤具体步骤第一步第一步第二步第二步设定一个“真实”的总体回归模型:其中 服从标准正态分布,样本容量N=20,其中Xi 分别取值如下:16、13、90、88、10、11、97、86、19、11、15、95、12、87、11、88、94、99、15、96。(3.5.1)从标准正态分布中随机抽取 值,将X的- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 一元 线性 回归 模型 计量 经济学
咨信网温馨提示:
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【可****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【可****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【可****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【可****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
关于本文