一元回归及简单相关分析.pptx
《一元回归及简单相关分析.pptx》由会员分享,可在线阅读,更多相关《一元回归及简单相关分析.pptx(46页珍藏版)》请在咨信网上搜索。
1、第十章第十章 一元回归及简单相关分析一元回归及简单相关分析上课提纲:上课提纲:一、回归和相关的基本概念一、回归和相关的基本概念二、一元线性回归二、一元线性回归三、一元非线性回归三、一元非线性回归四、相关四、相关重点:回归方程的拟合及其显著性检验重点:回归方程的拟合及其显著性检验难点:回归的方差分析难点:回归的方差分析 前面,我们所讨论的统计方法,只涉及一个前面,我们所讨论的统计方法,只涉及一个变量。例如,在不同品种的产量比较试验中,每变量。例如,在不同品种的产量比较试验中,每一品种一品种平均数反映产量的集中点平均数反映产量的集中点。标准差反映了标准差反映了产量的离散程度产量的离散程度。如作物产
2、量,通过计算平均数。如作物产量,通过计算平均数和标准差,就可知道这种作物在产量上的总体和和标准差,就可知道这种作物在产量上的总体和变异情况,进而根据变异程度进行变异情况,进而根据变异程度进行u-检验、检验、t-检检验、验、F-检验和检验和x2-检验,并可确定那个品种好,那检验,并可确定那个品种好,那个品种不好;可筛选出适宜的条件或措施,等等,个品种不好;可筛选出适宜的条件或措施,等等,而这些都只涉猎产量一个变量,而产量不仅与品而这些都只涉猎产量一个变量,而产量不仅与品种有关,还与施肥量种有关,还与施肥量 、播种密度、及灌水量、播种密度、及灌水量等多种因素有关。因此在试验研究的过程中,经等多种因
3、素有关。因此在试验研究的过程中,经常要研究两个或两个以上变量间的相关关系。事常要研究两个或两个以上变量间的相关关系。事物间或现象间的关系,这种物间或现象间的关系,这种研究事物间或现象间研究事物间或现象间关系的统计方法就属于回归和相关关系的统计方法就属于回归和相关。第十章第十章 一元回归及简单相关分析一元回归及简单相关分析一、回归与相关的基本概念一、回归与相关的基本概念 回回归归这这个个名名称称是是英英国国遗遗传传学学家家Frances Golton提提出出来来的的。他他研研究究了了人人的的身身高高、肘肘长长和和手手的的跨跨距距等等,发发现现:身身材材高高的的父父母母所所生生子子女女的的身身材材
4、也也高高,但但是是高高身身材材的的父父母母所所生生子子女女的的平平均均身身高高不不如如他他们们父父母母那那么么高高,但但子子女女的的身身高高是是依依靠靠父父母母的的身身高高,他他把把这这种种趋趋向向称称作作回回归归,即即回回归归到到全全体体人人口口的的平平均均身身高高,这这种种子子女女身身高高依依赖父母身高的关系就是回归关系赖父母身高的关系就是回归关系。回回归归关关系系是是一一种种函函数数关关系系,但但它它不不同同于于数数学学上上的的函函数数关关系系。数数学学上上的的函函数数关关系系是是一一种种确确定定性性的的关关系系,比比如如,圆圆的的面面积积S=r2,你你抽抽取取多多少少个个总总体体,都都
5、遵遵从从这这一一关关系系;而而回回归归关关系系是是一一种种非非确确定定性性的的关关系系,总总体体不不同同,函函数数关关系系就就发发生生变变化化。生生物物统统计计就就是是从从这这种种非非确确定定性性关关系系中中去去了了解解变变量量间间的的联联系系。表表述述这这种种变变量量间间的的联系有两个指标:回归和相关。联系有两个指标:回归和相关。对两个变量,一个变量用符号对两个变量,一个变量用符号x x表示,另一个表示,另一个变量用变量用y y表示,如果通过试验或调查获得两个变表示,如果通过试验或调查获得两个变量的成对观测值,可表示为量的成对观测值,可表示为(x1,y1),(x2,y2 ),(xn,yn)。
6、为了直观看出。为了直观看出x x和和y y变化关系变化关系可将每一对观测值在平面直角坐标系中表示成可将每一对观测值在平面直角坐标系中表示成一个点,作成散点图。一个点,作成散点图。图图10101 x1 x和和y y之间的关系之间的关系 从散点图可以看出:从散点图可以看出:两个变量间关两个变量间关系的性质和程度;系的性质和程度;两个变量间关系的类两个变量间关系的类型,是直线型还是曲线型;型,是直线型还是曲线型;是否有异常是否有异常观测值的干扰等。例如图观测值的干扰等。例如图10101 1是三幅两个是三幅两个变量的散点图,图变量的散点图,图a a和图和图b b都是直线型的,都是直线型的,但图但图a
7、a的两个变量关系较图的两个变量关系较图b b密切,且是正密切,且是正向的,即向的,即x增加增加y心也增加,图心也增加,图b b是负向的,是负向的,图图c c的两个变量之间关系是曲线型的。由散的两个变量之间关系是曲线型的。由散点图表示两个变量之间的关系只是定性的点图表示两个变量之间的关系只是定性的研究,为了探讨它们之间的规律性,必须研究,为了探讨它们之间的规律性,必须根据观测值将期理论关系推导出来。根据观测值将期理论关系推导出来。研究两个变量的关系可采用回归与相关的分析统计研究两个变量的关系可采用回归与相关的分析统计方法。如果两个变量间关系属于因果关系,一般用回归方法。如果两个变量间关系属于因果
8、关系,一般用回归来研究。表示原因的变量称为自变量,用来研究。表示原因的变量称为自变量,用x x表示。自变表示。自变量是固定的量是固定的(试验时预先确定的试验时预先确定的),没有随机误差。表示,没有随机误差。表示结果的变量称为依变量,用结果的变量称为依变量,用y y表示表示 并有随机误差。例并有随机误差。例如作物施肥和产量之间的关系,前者是表示原因的变量,如作物施肥和产量之间的关系,前者是表示原因的变量,为事先确定的,是自变量,后者是表示结果的变量,且为事先确定的,是自变量,后者是表示结果的变量,且具有随机误差,为依变量,作物产量是随施肥量的变化具有随机误差,为依变量,作物产量是随施肥量的变化而
9、变化的。(一个自变量而变化的。(一个自变量x x可以有许多可以有许多y y值和它对应)值和它对应)回归分析的目的是揭示呈因果关系的变量之间的联回归分析的目的是揭示呈因果关系的变量之间的联系形式,建立回归方程,利用建立回归方程由自变量来系形式,建立回归方程,利用建立回归方程由自变量来预测和控制依变量。预测和控制依变量。如果两变量是平行关系,只能用相关来进行如果两变量是平行关系,只能用相关来进行研究。在相关分析中,无自变量和依变量之分,研究。在相关分析中,无自变量和依变量之分,且都具有随机误差。(两个变量取值不是一对一且都具有随机误差。(两个变量取值不是一对一的)相关分析只能研究两个变量之间相关程
10、度和的)相关分析只能研究两个变量之间相关程度和性质,不能用一个变量的变化去预测另一个变量性质,不能用一个变量的变化去预测另一个变量的变化,这是回归与相关区别的关键所在。的变化,这是回归与相关区别的关键所在。显显然然,相相关关关关系系中中两两个个随随机机变变量量没没有有谁谁依依赖赖谁谁的的关关系系,而而回回归归关关系系中中随随机机变变量量是是依依赖赖于于变变量量的的。对对于于回回归归分分析析而而言言,我我们们不不但但要要弄弄清清楚楚谁谁依依赖谁,而且要搞明白依赖程度是否显著。赖谁,而且要搞明白依赖程度是否显著。相关关系(相关关系(correlation)两个随机变量(两个随机变量(X和和Y)的相
11、互对应关系(的相互对应关系(X Y)。)。回归关系(回归关系(regression)一个变量(一个变量(X)和一个)和一个 随机变量(随机变量(Y)的对应关系()的对应关系(X Y)。)。简单直线相关与回归的区别简单直线相关与回归的区别 p 156 1在资料要求上,相关要求两变量在资料要求上,相关要求两变量x、y都是随机变量,都是随机变量,如动物体高与体重两者都不能预先指定;回归要求依变如动物体高与体重两者都不能预先指定;回归要求依变量量y是随机变员,而自变量是随机变员,而自变量x可以是随机变量,亦可以指可以是随机变量,亦可以指定,幅养试验中建立采食量与增重的回归关系,动物采定,幅养试验中建立
12、采食量与增重的回归关系,动物采食量可以人为控制食量可以人为控制 2在意义上相关反映两变量间在意义上相关反映两变量间相互依赖的平行关系相互依赖的平行关系;而回归则反映一个变量对另一变量的而回归则反映一个变量对另一变量的单向单向依赖关系依赖关系 3在应用上,说明两变量间的相关程度用相关;说明两在应用上,说明两变量间的相关程度用相关;说明两现象间变化的数量关系用现象间变化的数量关系用 回归回归第十章第十章 一元回归及简单相关分析一元回归及简单相关分析、一元回归分析的意义、一元回归分析的意义二、一元线性回归二、一元线性回归1、较少的工作量就可掌握事物或现象的趋势或规律;、较少的工作量就可掌握事物或现象
13、的趋势或规律;假如土壤中假如土壤中NaCl含量为含量为3.7g kg-1,叶干重是多少?,叶干重是多少?因为:因为:y=11.161x+81.786x=3.7所以:所以:y=11.1613.7+81.786=123.1 mg dm-2 2、预测事物或现象的具体变化;、预测事物或现象的具体变化;对于重复对于重复1:80、90、95、115、130、115、135样本方差:样本方差:s2=431 因为:因为:y=11.161x+81.786 误差均方:误差均方:MSe=70.7。误差均方是样本方差的误差均方是样本方差的16.4。因此,只有在引进自变量以后所得到的实验误差,因此,只有在引进自变量以后
14、所得到的实验误差,才是真正的实验误差。才是真正的实验误差。3、减小实验误差。、减小实验误差。第十章第十章 一元回归及简单相关分析一元回归及简单相关分析二、一元线性回归二、一元线性回归、一元直线回归模型的建立、一元直线回归模型的建立:1、内涵、内涵 为了描述两变量间的数量关系,当自变量为了描述两变量间的数量关系,当自变量 时,时,因变量因变量Y的平均数的平均数 与之相对应,那么,与之相对应,那么,称为称为Y的的条件平均数(条件平均数(conditional mean)。在实验无限重复后,可以得到各在实验无限重复后,可以得到各xi上上Y的条件平均的条件平均数数 ,这些平均数构成一条直线:,这些平均
15、数构成一条直线:式中:式中:为直线的截距为直线的截距(intercept),为斜率为斜率(slope)。对于一对给定的对于一对给定的X和和Y与直线与直线 的离差(随机误的离差(随机误差)差),它独立于,它独立于X且服从于同一正态分布且服从于同一正态分布 。如如上上回回归归模模型型只只包包含含一一个个自自变变量量X且且具具有有正正态态性性,所以称为所以称为一元正态线性回归模型一元正态线性回归模型。一一般般情情况况下下,得得不不到到真真正正的的和和,只只能能求求出出它它们们的估计值的估计值a和和b,从而得到一条估计的直线:,从而得到一条估计的直线:回归方程回归方程估计值估计值回归系数回归系数画出的
16、线画出的线叫回归线叫回归线第十章第十章 一元回归及简单相关分析一元回归及简单相关分析、一元直线回归模型的建立、一元直线回归模型的建立:2、模型建立、模型建立二、一元线性回归二、一元线性回归每一次每一次a a和和b b取值不同,每一个取值不同,每一个数据点的数据点的 不同。不同。对于所有点而言,每一次对于所有点而言,每一次a a和和b b取值不同,每一个数据点的离取值不同,每一个数据点的离差差 不同。不同。回归分析中,要使每一个离差回归分析中,要使每一个离差 都很小,必须选取适都很小,必须选取适当的常数当的常数a和和b,使得:,使得:达到最小,进而保证每个离差的绝对值都很小。这种达到最小,进而保
17、证每个离差的绝对值都很小。这种根据离差的根据离差的平方和为最小的条件来选择常数的方法称为最小二乘法平方和为最小的条件来选择常数的方法称为最小二乘法(method of least square)。)。第十章第十章 一元回归及简单相关分析一元回归及简单相关分析 目的明确以后,把目的明确以后,把L看成为自变量看成为自变量a 和和b的一个二元函数,那么的一个二元函数,那么问题就可归结为求函数问题就可归结为求函数L=L(a,b)在那些点处取得的最小值,这样在那些点处取得的最小值,这样就可就可通过数学方法可求出使通过数学方法可求出使L达到最小时的常数达到最小时的常数a和和b。二、一元线性回归二、一元线性
18、回归、一元直线回归模型的建立、一元直线回归模型的建立:2、模型建立、模型建立得正规方程(得正规方程(normal equation):):解正规方程,得到解正规方程,得到和和的的最小二乘估计最小二乘估计a和和b:校正交叉乘积和校正交叉乘积和SXYX的校正平方和的校正平方和SXX计算估计值计算估计值a和和b时的程序:时的程序:X和和Y的的校正交叉乘积和:校正交叉乘积和:X的的校正平方和:校正平方和:Y的的校正平方和:校正平方和:直线回归方程的两个直线回归方程的两个性质:性质:(1);(2)回归直线必须通回归直线必须通过中心点过中心点 。(2)计算校正项:)计算校正项:(3)计算估计值)计算估计值
19、a和和b:(1)计算观测平均值:)计算观测平均值:二、一元线性回归二、一元线性回归第十章第十章 一元回归及简单相关分析一元回归及简单相关分析、一元直线回归模型的建立、一元直线回归模型的建立:3、例题、例题例题例题10-1 10-1 土壤不同含盐量时小麦收获的叶干重如下表:土壤不同含盐量时小麦收获的叶干重如下表:试建立土壤含盐量与小麦叶干重的直线回归方程。试建立土壤含盐量与小麦叶干重的直线回归方程。解:解:分别求出分别求出SXY、SXX、SYY 回回 归归 系系 数数b=11.16,表表示示当当自自变变量量每每变变动动一一个个单单位位,因因变变量量变动变动11.16个单位。个单位。二、一元线性回
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 一元 回归 简单 相关 分析
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【可****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【可****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。