应用回归分析课后习题参考答案.doc
《应用回归分析课后习题参考答案.doc》由会员分享,可在线阅读,更多相关《应用回归分析课后习题参考答案.doc(45页珍藏版)》请在咨信网上搜索。
1、第二章 一元线性回归分析思考与练习参考答案 2.1 一元线性回归有哪些基本假定?答: 假设1、解释变量X是确定性变量,Y是随机变量; 假设2、随机误差项具有零均值、同方差和不序列相关性: E(i)=0 i=1,2, ,n Var (i)=s2 i=1,2, ,n Cov(i, j)=0 ij i,j= 1,2, ,n 假设3、随机误差项与解释变量X之间不相关: Cov(Xi, i)=0 i=1,2, ,n 假设4、服从零均值、同方差、零协方差的正态分布 iN(0, s2 ) i=1,2, ,n2.2 考虑过原点的线性回归模型 Yi=1Xi+i i=1,2, ,n误差i(i=1,2, ,n)仍满
2、足基本假定。求1的最小二乘估计解:得:2.3 证明(2.27式),Sei =0 ,SeiXi=0 。证明:其中:即: Sei =0 ,SeiXi=02.4回归方程E(Y)=0+1X的参数0,1的最小二乘估计与最大似然估计在什么条件下等价?给出证明。答:由于iN(0, s2 ) i=1,2, ,n所以Yi=0 + 1Xi + iN(0+1Xi , s2 )最大似然函数:使得Ln(L)最大的,就是0,1的最大似然估计值。同时发现使得Ln(L)最大就是使得下式最小,上式恰好就是最小二乘估计的目标函数相同。值得注意的是:最大似然估计是在iN(0, s2 )的假设下求得,最小二乘估计则不要求分布假设。
3、所以在iN(0, s2 ) 的条件下, 参数0,1的最小二乘估计与最大似然估计等价。2.5 证明是0的无偏估计。证明:2.6 证明证明:2.7 证明平方和分解公式:SST=SSE+SSR证明:2.8 验证三种检验的关系,即验证:(1);(2)证明:(1)(2)2.9 验证(2.63)式:证明:其中:2.10 用第9题证明是s2的无偏估计量证明:2.11 验证决定系数与F值之间的关系式证明:2.14 为了调查某广告对销售收入的影响,某商店记录了5个月的销售收入y(万元)和广告费用x(万元),数据见表2.6,要求用手工计算:表2.6月份12345X12345Y1010202040(1) 画散点图(
4、略)(2) X与Y是否大致呈线性关系?答:从散点图看,X与Y大致呈线性关系。(3) 用最小二乘法估计求出回归方程。计算表XY1104100206(-14)2(-4)221011001013(-7)2(3)2320000200042010027727254044004034142(-6)2和15100和Lxx=10Lyy=600和Lxy=70和100SSR=490SSE=110均3均20均20回归方程为:(4) 求回归标准误差先求SSR(Qe)见计算表。所以(5) 给出 的置信度为95%的区间估计;由于(1-a)的置信度下, 的置信区间是 查表可得所以 的95%的区间估计为:(73.182*1.
5、915,7+3.182*1.915),即(0.906,13.094)。所以 的95%的区间估计为:(-1-3.182*6.351,-1+3.182*6.351),即(-21.211, 19.211)。的置信区间包含0,表示不显著。(6) 计算x和y的决定系数 说明回归方程的拟合优度高。(7) 对回归方程作方差分析方差分析表方差来源平方和自由度均方F值SSR490149013.364SSE110336.667SST6004F值=13.364F0.05(1,3)=10.13(当n=1,n=8时,=0.05查表得对应的值为10.13),所以拒绝原假设,说明回归方程显著。(8)做回归系数1的显著性检验
6、H0: 1=0t值=3.656t0.05/2(3)=3.182,所以拒绝原假设,说明x对Y有显著的影响。(8) 做相关系数R的显著性检验R值=0.904R0.05(3)=0.878,所以接受原假设,说明x和Y有显著的线性关系。(9) 对回归方程作残差图并作相应的分析残差图(略) .从残差图上看出,残差是围绕e=0在一个固定的带子里随机波动,基本满足模型的假设eiN(0, s2 ), 但由于样本量太少, 所以误差较大.(10) 求广告费用为4.2万元时,销售收入将达到多少?并给出置信度为95%的置信区间.解: 当X0=4.2时, 所以广告费用为4.2万元时, 销售收入将达到28.4万元.由于置信
7、度为1-时,Y0估计值的置信区间为:所以求得Y0的95%的置信区间为: 6.05932 ,50.74068预测误差较大.2.15 一家保险公司十分关心其总公司营业部加班的制度,决定认真调查一下现状。经过十周时间,收集了每周加班工作时间的数据和签发的新保单数目,x为每周新签发的保单数目,y为每周加班工作时间(小时)。见表2.7。表2.7周序号12345678910X825215107055048092013503256701215Y3.51.04.02.01.03.04.51.53.05.01、画散点图2、由散点图可以看出, x与y之间大致呈线性关系。3、用最小二乘法求出回归系数由表可知: 回归
8、方程为: 4、求回归标准误差由方差分析表可以得到:SSE=1.843 故回归标准误差,=0.48。5、给出回归系数的置信度为95%的区间估计由回归系数显著性检验表可以看出,当置信度为95%时:的预测区间为-0.701,0.937, 的预测区间为0.003,0.005.的置信区间包含0,表示不拒绝为零的假设。6、决定系数 由模型概要表得到决定系数为0.9接近于1,说明模型的拟合优度高。 7. 对回归方程作方差分析由方差分析表可知:F值=72.3965.32(当n=1,n=8时,查表得对应的值为5.32)P值0,所以拒绝原假设,说明回归方程显著。8、对的显著性检验从上面回归系数显著性检验表可以得到
9、的t统计量为t=8.509,所对应的p值近似为0,通过t检验。说明每周签发的新保单数目x对每周加班工作时间y有显著的影响。9.做相关系数显著性检验相关系数达到0.949,说明x与y显著线性相关。10、对回归方程作残差图并作相应分析从残差图上看出,残差是围绕e=0随即波动,满足模型的基本假设。11、该公司预计下一周签发新保单X0=1000张,需要的加班时间是多少?当x=1000张时,小时12、给出Y0的置信水平为95%的预测区间 通过SPSS运算得到Y0的置信水平为95%的预测区间为:(2.5195,4.8870)。13 给出E(Y0)的置信水平为95%的预测区间通过SPSS运算得到Y0的置信水
10、平为95%的预测区间为:(3.284,4.123)。2.16 表是1985年美国50个州和哥伦比亚特区公立学校中教师的人均年工资y(美元)和学生的人均经费投入x(美元).序号yx序号yx序号yx11958333461820816305935195382642220263311419180952967362046031243203253554202093932853721419275242680045422122644391438251603429529470466922246244517392248239476266104888232718643494020969250973067857102
11、433990502041272245440827170553625233823594422589240429258534168262062728214322644340210245003547272279533664424640282911242743159282157029204522341229712271703621292208029804625610293213301683782302225037314726015370514265254247312094028534825788412315273603982322180025334929132360816216903568332293
12、4272950414808349172197431553418443230551258453766解答:(1)绘制y对x的散点图,可以用直线回归描述两者之间的关系吗?由上图可以看出y与x的散点分布大致呈直线趋势。(2)建立y对x的线性回归。利用SPSS进行y和x的线性回归,输出结果如下:表1 模型概要RR2调整后的R2随机误差项的标准差估计值0.8350.6970.6912323.25589表2 方差分析表模型平方和自由度和平均F值P值1回归平方和6.089E816.089E8112.811.000a残差平方和2.645E8495397517.938总平方和8.734E850表3 系数表模型非
13、标准化系数标准化系数t值P值B标准差回归系数1常数12112.6291197.76810.113.000对学生的人均经费投入3.314.312.83510.621.0001) 由表1可知,x与y决定系数为,说明模型的拟合效果一般。x与y线性相关系数R=0.835,说明x与y有较显著的线性关系。2) 由表2(方差分析表中)看到,F=112.811,显著性Sig.p,说明回归方程显著。3) 由表3 可见对的显著性t检验P值近似为零,故显著不为0,说明x对y有显著的线性影响。4) 综上,模型通过检验,可以用于预测和控制。x与y的线性回归方程为:(3)绘制标准残差的直方图和正态概率图图1 标准残差的直
14、方图理论正态概率观测值概率 图2 标准残差的正态概率P-P图由图1可见标准化后残差近似服从正态分布,由图2可见正态概率图中的各个散点都分布在45线附近,所以没有证据证明误差项服从同方差的正态分布的假定是不真实的,即残差通过正态性检验,满足模型基本假设。第3章 多元线性回归思考与练习参考答案3.2 讨论样本容量n与自变量个数p的关系,它们对模型的参数估计有何影响?答:在多元线性回归模型中,样本容量n与自变量个数p的关系是:np。如果n4.76,p值=0.015,拒绝原假设,由方差分析表可以得到,说明在置信水平为95%下,回归方程显著。(5)对每一个回归系数作显著性检验;做t检验:设原假设为,统计
15、量服从自由度为n-p-1的t分布,给定显著性水平0.05,查得单侧检验临界值为1.943,X1的t值=1.9421.943。拒绝原假设。由上表可得,在显著性水平时,只有的P值4.74,p值=0.007,拒绝原假设.认为在显著性水平=0.05下,x1,x2整体上对y有显著的线性影响,即回归方程是显著的。对每一个回归系数做显著性检验:做t检验:设原假设为,统计量服从自由度为n-p-1的t分布,给定显著性水平0.05,查得单侧检验临界值为1.895,X1的t值=2.5751.895,拒绝原假设。故显著不为零,自变量X1对因变量y的线性效果显著;同理2也通过检验。同时从回归系数显著性检验表可知:X1,
16、X2的p值 都小于0.05,可认为对x1,x2分别对y都有显著的影响。(7)求出每一个回归系数的置信水平为955D 置信区间由回归系数表可以看到,1置信水平为95%的置信区间0.381,8.970,2置信水平为95%的置信区间3.134,14.808(8)求标准化回归方程由回归系数表(上表)可得,标准化后的回归方程为:(9)求当x01=75,x02=42,x03=3.1时的y的预测值,给定置信水平95%,用SPSS软件计算精确置信区间,用手工计算近似预测区间;由SPSS输出结果可知,当时,(见上表),的置信度为95%的精确预测区间为(204.4,331.2)(见下表),的置信度为95%的近似预
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 回归 分析 课后 习题 参考答案
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【精****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【精****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。