影响财政收入因素的应用回归分析.doc
《影响财政收入因素的应用回归分析.doc》由会员分享,可在线阅读,更多相关《影响财政收入因素的应用回归分析.doc(15页珍藏版)》请在咨信网上搜索。
影响财政收入因素的应用回归分析 影响财政收入因素的应用回归分析 内容提要 我们主要是要来研究影响财政收入的主要因素有哪些,之所以研究这一问题,是因为,财政收入对于国民经济的运行及社会发展具有重要影响。我们通过对1990到2008年连续19年的财政收入为因变量,初步选取了7个影响因素,做多元线性回归分析,建立回归模型,并通过对回归系数做显著性检验与逐步回归来分析数据,从国民经济部门结构看,财政收入又表现为来自各经济部门的收入。财政收入的部门构成就是在财政收入中,由来自国民经济各部门的收入所占的不同比例来表现财政收入来源的结构,它体现国民经济各部门与财政收入的关系。我国财政收入主要来自于工业、农业、商业、交通运输和服务业等部门。其中工业和农业对财政收入的影响最大。 关键词 多元线性回归分析;显著性检验;逐步回归,财政收入 在我国,财政收入的主体是税收收入。因此,在税收体制及政策不变的情况下,财政收入会随着经济繁荣而增加,随着经济衰退而下降。财政收入是国家对经济实行宏观调控的重要经济杠杆。宏观调控的首要问题是社会总需求与总供给的平衡问题,实现社会总需求与总供给的平衡,包括总量上的平衡和结构上的平衡两个层次的内容。财政收入的杠杆既可通过增收和减收来发挥总量调控作用,也可通过对不同财政资金缴纳者的财政负担大小的调整,来发挥结构调整的作用。此外,财政收入分配也是调整国民收入初次分配格局,实现社会财富公平合理分配的主要工具。本文以多元线性回归为出发点,选取我国自1990至2008年连续19年的财政收入为因变量,初步选取了7个影响因素,从而得出了结论,最后我们用2009年的数据进行了验证,得出的结果在误差范围内,表明这个模型可以正确反映影响财政收入的各因素的情况。 一、 多元线性回归分析的原理和模型 (一)一元线性回归模型 1. 普通最小二乘估计(Ordinary Least Square Estimation,简记为OLSE) 最小二乘法就是寻找参数β0、β1的估计值 使离差平方和达极小 称为yi的回归拟合值,简称回归值或拟合值 称为yi的残差 经整理后,得正规方程组 得OLSE 为 记 2. 最大似然估计 连续型:是样本的联合密度函数: 离散型:是样本的联合概率函数。 似然函数并不局限于独立同分布的样本 似然函数y1,y2,…,yn的为 函数为对数似然: 与最小二乘原理完全相同 (二)多元线性回归分析模型 1. 多元线性回归模型的一般形式 设随机变量y与一般变量的线性回归模型为 对n组观测数据 (xi1, xi2,…,xip; yi), i=1,2,…,n, 线性回归模型表示为: 写成矩阵的形式为: (三)多元线性回归参数的普通最小二乘估计 1. 最小二乘估计 最小二乘估计要寻找 经整理后得用矩阵形式表示的正规方程组 移项得存在时,即得回归参数的最小二乘估计为: . 2. 回归值与残差 3. 为回归值 称为帽子矩阵,其主对角线元素记为hii ,则 此式的证明只需根据迹的性质tr(AB)=tr(BA),因而 得D(ei)=(1-hii)σ2,i=1,2,…,n 是σ2的无偏估计 3. 回归参数的最大似然估计 似然函数为 等价于使达到最小,这又完全与OLSE一样。 (四)多元线性回归分析回归方程的显著性检验。 1. F检验 H0:β1=β2=…=βp=0 SST = SSR + SSE 当H0成立时服从 方差来源 自由度 平方和 均方 F值 P值 回归 残差 总和 p n-p-1 n-1 SSR SSE SST SSR/P SSE/(n-p-1) P(F>F值)=P值 2. 回归系数的显著性检验 H0j:βj=0, j=1,2,…,p ~N(β,σ2(X'X)-1) 记 (X'X)-1=(cij) i,j=0,1,2,… ,p 构造t统计量 其中 3. 回归系数的置信区间 可得βj的置信度为1-α的置信区间为: 4. 拟合优度 决定系数为: y关于x1,x2,…,xp的样本复相关系数 (五)相关阵及偏相关系数 1. 样本相关阵 自变量样本相关阵 增广的样本相关阵为: 2. 两个自变量的偏判定系数 3. 一般情况 在模型中已含有x2,…,xp时,y与x1的偏判定系数为: 4. 偏相关系数 对任意p个变量x1,x2,…,xp定义它们之间的偏相关系数 其中符号Δij表示相关阵第i行第j列元素的代数余子式 验证 二、对国家财政收入及各项指标做多元线性回归分析 (一)样本数据的选取与整理 本文在进行统计时,查阅《中国统计年鉴2010》中收录的1990年至2009年连续20年的全国财政收入为因变量,考虑一些与能源消耗关系密切并且直观上有线性关系的因素,初步选取这十九年的国内总产值、工业总产值、人口总数、建筑业、农业、受灾面积和商品零售总额等因素为自变量,分析它们之间的联系。 根据选择的指标,从《中国统计年鉴2010》查选数据,整理如表2-1所示。 表2-1 1990-2009年财政收入及其影响因素统计表 工业 (亿元) 农业 (亿元) 受灾面积(千公顷) 建筑业 (亿元) 人口 (万人) 社会商品零售总额(亿元) 财政收入 (亿元) 国民生产总值(亿元) 1990 18689.22 7662.1 38474 1345 114333 8300.1 2937.1 18718.3 1991 22088.68 8157 55472 1564.3 115823 9415.6 3149.48 21826.2 1992 27724.21 9084.7 51333 2174.4 117171 10993.7 3483.37 26937.3 1993 39693 10995.5 48829 3253.5 118517 14270.4 4348.95 35260.0 1994 51353.03 15750.5 55043 4653.3 119850 18622.9 5218.1 48108.5 1995 54946.86 20340.9 45821 5793.8 121121 23613.8 6242.2 59810.5 1996 62740.16 22353.7 46989 8282.2 122389 28360.2 7407.99 70142.5 1997 68352.68 23788.4 53429 9126.5 123626 31252.9 8651.14 78060.8 1998 67737.14 24541.9 50145 10062 124761 33378.1 9875.95 83024.3 1999 72707.04 24519.1 49981 11152.9 125786 35647.9 11444.08 88479.2 2000 85673.66 24915.8 54688 12497.6 126743 39105.7 13395.23 98000.5 2001 95448.98 26179.6 52215 15361.5 127627 43055.4 16386.04 108068.2 2002 110776.48 27390.8 47119.1 18527.1 128453 48135.9 18903.64 119095.7 2003 142271.22 29691.8 54506.3 23083.8 129227 52516.3 21715.25 135174.0 2004 201722.19 36239 37106.256 27745.3 129988 59501 26396.47 159586.7 2005 251619.5 39450.9 38818.225 34552.0 130756 67176.6 31649.29 185808.6 2006 316588.96 40810.8 41091.41 41557.1 131448 76410 38760.2 217522.7 2007 405177.13 48892.9 35972.23 51043.7 132129 89210 51321.78 267763.7 2008 130260.2 33702.0 56234.26 18743.2 132802 116032 61330.35 316228.8 2009 135239.9 35226.0 50223.51 22398.8 133474 14894 68518.30 343464.7 1.模型的建立与分析 将数据录入统计软件excel,建立统计数据库,先建立财政收入与各变量的散点图,如图2-1至图2-6所示。 图2-1 财政收入与工业总产值的散点图 图2-2 财政收入与农业总产值的散点图 图2-3 财政收入与受灾面积的散点图 图2-4 财政收入与人口总数的散点图 图2-5 财政收入与商品零售总额的散点图 图2-6 财政收入与国内总产值的散点图 从散点图中看出,国内生产总值、工业生产总值、农业、商品零售总额这四个变量与财政收入总量基本呈线性分布;而人口总数虽然也与财政收入存在正比的关系,但是从直观上看线性关系不显著,并且人口因素呈现指数关系。受灾面积与财政收入总量的关系不明显。因此为使得到的模型有显著的线性关系,在选取进入回归模型的自变量时,就要进行筛选。下面给出筛选过程。 (1)将国内生产总值、农业、工业生产总值、建筑业和商品零售总额纳入自变量,逐步回归法,输出结果如图2-7(a)(b)所示。 从结果可以看出,该回归的F值为1600.595,查表得,显而易见,回归的显著性很好;但是由于在这里我们要分析的是影响财政收入的具体产业,而该结果只说明了财政收入与国民生产总值的相关性很好,并不能说明问题的根本所在。所以在下面的分析中我们将剔除国民生产总值这个因素做进一步的分析。 Anovab 模型 平方和 df 均方 F Sig. 1 回归 7.506E9 1 7.506E9 1600.595 .000a 残差 8.441E7 18 4689341.382 总计 7.590E9 19 a. 预测变量: (常量), 国民生产总值 b. 因变量: 财政收入 模型汇总b 模型 R R 方 调整 R 方 标准估计 的误差 更改统计量 Durbin- Watson R 方更改 F 更改 df1 df2 Sig. F 更改 1 .994a .989 .988 2165.489 .989 1600.595 1 18 .000 .200 a. 预测变量: (常量), 国民生产总值 b. 因变量: 财政收入 图2-7(a)(b) 输出结果 (2)将工业生产总值、农工、建筑业和商品零售总额纳入自变量,逐步回归法,输出结果如图2-8(a)(b)(c)所示。 Anovab 模型 平方和 df 均方 F Sig. 1 回归 4.757E9 1 4.757E9 30.215 .000a 残差 2.834E9 18 1.574E8 总计 7.590E9 19 a. 预测变量: (常量), 农业 b. 因变量: 财政收入 模型汇总b 模型 R R 方 调整R 方 标准估计 的误差 更改统计量 Durbin -Watson R 方更改 F 更改 df1 df2 Sig. F 更改 1 .792a .627 .606 12546.807 .627 30.215 1 18 .000 .390 a. 预测变量: (常量), 农业 b. 因变量: 财政收入 图2-8(a)(b)(c) 输出结果 从结果可以看出,该回归的F值为30.215,查表得,显而易见,回归的显著性很好;但是对回归系数的显著性来说,从直方图中可以看出,采用以上三个变量作为自变量得到的线性模型仍不是很好。 这个模型也不是理想中的模型,所以下面我们试图根据我们的判断对样本数据进行筛选,力求得出比较理想的模型。 (3)下面我将农业这个变量暂且剔除,只采用工业、建筑业和商品零售总额作为自变量,采用逐步回归法,输出结果如图2-9(a)(b)所示。 从结果可以看出,该回归的F值为20.219,查表得,显而易见,回归的显著性很好;但是对回归系数的显著性来说,建筑业的t检验值为0.0002,查表得,显然回归系数的显著性不好。以上检验得到的与利用P值法(图中的Sig值)得到的检验结果相符。因此,采用以上三个变量作为自变量得到的线性模型仍不是很好。 同时可以看出,只对建筑业做回归分析时,F值为20.19,查表得到,这证明一元回归模型和回归系数的显著性都很好。 Anovab 模型 平方和 df 均方 F Sig. 1 回归 4.015E9 1 4.015E9 20.219 .000a 残差 3.575E9 18 1.986E8 总计 7.590E9 19 a. 预测变量: (常量), 建筑业 b. 因变量: 财政收入 模型汇总b 模型 R R 方 调整 R 方 标准估计 的误差 更改统计量 Durbin -Watson R 方更改 F 更改 df1 df2 Sig. F 更改 1 .727a .529 .503 14092.439 .529 20.219 1 18 .000 .546 a. 预测变量: (常量), 建筑业 b. 因变量: 财政收入 图2-9(a)(b) 输出结果 (4)只将工业和商品零售总额纳入自变量,输出结果如图2-10(a)(b)所示。 Anovab 模型 平方和 df 均方 F Sig. 1 回归 3.498E9 1 3.498E9 15.390 .001a 残差 4.092E9 18 2.273E8 总计 7.590E9 19 a. 预测变量: (常量), 工业。 b. 因变量: 财政收入 系数a 模型 非标准化系数 标准系数 t Sig. 共线性统计量 B 标准 误差 试用版 容差 VIF 1 (常量) 4994.365 5206.020 .959 .350 工业 .132 .034 .679 3.923 .001 1.000 1.000 a. 因变量: 财政收入 图2-10(a)(b) 输出结果 从上图结果中可以看出,对这两个变量做回归分析时,F值为15.39,证明一元回归模型和回归系数的显著性都很好。 三、分析结果 由以上筛选和分析过程可以看出,财政收入Y分别对X7国内总产值、X1工业总产值、X4建筑业及商品零售总额X6进行一元回归分析时,其回归的显著性都很好,但是综合为一个多元回归模型时,则出现了某些系数不显著的现象。 综合比较选取的几个多元模型,将X4建筑业和X6商品零售总额纳入自变量时得到的模型效果最为显著,回归方程如下: 其中,。 四、结论 本次论文,根据查阅中国统计年鉴,列举了影响财政收入的7个因素。从直观上考虑,人口总量与受灾面积与财政收入存在线性关系,所以特意把这两个变量列到其中,但是散点图和回归效果显示这2个因素并没有进入逐步回归模型中,由此看来,这两项因素与财政收入存在的关系可能不是严格线性的,或者这种线性关系是长期的线性关系。 另外,在对进入模型的5个因素进行回归时发现,因变量对单独变量的回归性很显著,但是整合成多元回归出现了某些回归系数不显著的现象,具体原因可能是由于数据选取的太少,未能体现出长期线性这一特点。虽然得到的几个模型系数都不是很显著,但经综合比较,选取了一个较为显著的模型作为最“优”解。 对得到的最“优”回归模型做预测,置信度为95%。查阅中国统计年鉴,得到2009年的X4建筑业为22398.8(亿元),X6商品零售总额为14894(亿元),Y财政收入为68518.30(亿元),将自变量带入回归方程: 预测区间为, 其中。 代入数值得到置信度为95%的预测区间为,与查得的2009年能源消耗总量68518.30(亿元)比较接近。 得到的数据模型显示财政收入与建筑业、商品零售额有着密切的关系,这也很符合目前国家的经济状况。不过由于调研时间有限,上述回归模型存在一些不足,还需要不断查阅资料加以改进。但在一定程度上体现了与选取的自变量之间的线性关系,并能对因变量做出近似的预测。综合来看,数据模型基本达到了预期的目的。 参考文献 [1] 孙海燕,周梦,李卫国,冯伟. 应用数理统计[M]. 北京:北京航空航天大学数学系, 1999. [2] 张建同,孙昌言. 以Excel和SPSS为工具的管理统计[M]. 北京:清华大学出版社,2002. [3] 国家统计局.2010年中国统计年鉴[M]. 中国统计出版社,2010. 15- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 影响 财政收入 因素 应用 回归 分析
咨信网温馨提示:
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【丰****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【丰****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【丰****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【丰****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
关于本文