教育学相关与回归分析全.pptx
《教育学相关与回归分析全.pptx》由会员分享,可在线阅读,更多相关《教育学相关与回归分析全.pptx(114页珍藏版)》请在咨信网上搜索。
1、 不要过于教条地对待研究的结果,尤其当数据的质量受到怀疑时。Damodar N.Gujarati统计名言统计名言第八章 相关与回归分析8.1 相关分析相关分析8.2 一元线性回归分析一元线性回归分析8.3 多元线性回归分析多元线性回归分析8.4 非线性回归分析非线性回归分析 学习目标l相关关系的分析相关关系的分析l参数的最小二乘估计参数的最小二乘估计l回归直线的拟合优度回归直线的拟合优度l回归方程的显著性检验回归方程的显著性检验l利用回归方程进行预测利用回归方程进行预测l用用 Excel 和和SPSS进行回归进行回归子代与父代一样吗?Galton被誉为现代回归和相关技术的创始人。1875年,G
2、alton利用豌豆实验来确定尺寸的遗传规律。他挑选了7组不同尺寸的豌豆,并说服他在英国不同地区的朋友每一组种植10粒种子,最后把原始的豌豆种子(父代)与新长的豌豆种子(子代)进行尺寸比较。当结果被绘制出来之后,他发现并非每一个子代都与父代一样,不同的是,尺寸小的豌豆会得到更大的子代,而尺寸大的豌豆却得到较小的子代。Galton把这一现象叫做“返祖”(趋向于祖先的某种平均类型),后来又称之为“向平均回归”。一个总体中在某一时期具有某一极端特征(低于或高于总体均值)的个体在未来的某一时期将减弱它的极端性(或者是单个个体或者是整个子代),这一趋势现在被称作“回归效应”。人们发现它的应用很广,而不仅限
3、于从一代到下一代豌豆大小问题子代与父代一样吗?正如Galton进一步发现的那样,平均来说,非常矮小的父辈倾向于有偏高的子代;而非常高大的父辈则倾向于有偏矮的子代。在第一次考试中成绩最差的那些学生在第二次考试中倾向于有更好的成绩(比较接近所有学生的平均成绩),而第一次考试中成绩最好的那些学生在第二次考试中则倾向于有较差的成绩(同样比较接近所有学生的平均成绩)。同样,平均来说,第一年利润最低的公司第二年不会最差,而第一年利润最高的公司第二年则不会是最好的如果把父代和子代看作两个变量,找出这两个变量的关系,并根据这种关系建立适当的数学模型,就可以根据父代的数值预测子代的取值,这就是经典的回归方法要解
4、决的问题。学完本章的内容你会对回归问题有更深入的理解 8.1 变量间的关系变量间的关系 8.1.1 变量间是什么样的关系?变量间是什么样的关系?8.1.2 用散点图描述相关关系用散点图描述相关关系 8.1.3 用相关系数度量关系强度用相关系数度量关系强度第 8 章 相关与回归分析怎样分析变量间的关系?l建立回归模型时,首先需要弄清楚变量之间的关系。分析变量之间的关系需要解决下面的问题1.变量之间是否存在关系?2.如果存在,它们之间是什么样的关系?3.变量之间的关系强度如何?4.样本所反映的变量之间的关系能否代表总体变量之间的关系?8.1.1 变量间是什么样的关系?8.1 变量间的关系变量间的关
5、系 x xy y函数关系1.是一一对应的确定关系2.设有两个变量 x 和 y,变量 y 随变量 x 一起变化,并完全依赖于 x,当变量 x 取某个数值时,y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y=f(x),其中 x 称为自变量,y 称为因变量3.各观测点落在一条线上 函数关系函数关系(几个例子几个例子)函数关系的例子函数关系的例子某某种种商商品品的的销销售售额额y与与销销售售量量x之之间间的的关关系系可可表表示为示为 y=px(p 为单价为单价)圆的面积圆的面积S与半径之间的关系可表示为与半径之间的关系可表示为S=R2 企企业业的的原原材材料料消消耗耗额额y与与产产量量x
6、1、单单位位产产量量消消耗耗x2、原材料价格、原材料价格x3之间的关系可表示为之间的关系可表示为 y=x1 x2 x3 相关关系(几个例子)l子女的身高与其父母身高的关系子女的身高与其父母身高的关系u从遗传学角度看,父母身高较高时,其子女的身高一般也比较高。但实际情况并不完全是这样,因为子女的身高并不完全是由父母身高一个因素所决定的,还有其他许多因素的影响l一个人的收入水平同他受教育程度的关系一个人的收入水平同他受教育程度的关系u收入水平相同的人,他们受教育的程度也可能不同,而受教育程度相同的人,他们的收入水平也往往不同。因为收入水平虽然与受教育程度有关系,但它并不是决定收入的惟一因素,还有职
7、业、工作年限等诸多因素的影响l农作物的单位面积产量与降雨量之间的关系农作物的单位面积产量与降雨量之间的关系u在一定条件下,降雨量越多,单位面积产量就越高。但产量并不是由降雨量一个因素决定的,还有施肥量、温度、管理水平等其他许多因素的影响相关关系(correlation)1.一个变量的取值不能由另一个变量唯一确定2.当变量 x 取某个值时,变量 y 的取值对应着一个分分布布3.各观测点分布在直线周围 4.变量之间存在非严格确定的依存关系y y x x 相关关系相关关系(几个例子几个例子)相关关系的例子相关关系的例子父亲身高父亲身高y与子女身高与子女身高x之间的关系之间的关系收入水平收入水平y与受
8、教育程度与受教育程度x之间的关系之间的关系粮粮食食亩亩产产量量y与与施施肥肥量量x1、降降雨雨量量x2、温温度度x3之间的关系之间的关系商品的消费量商品的消费量y与居民收入与居民收入x之间的关系之间的关系商品销售额商品销售额y与广告费支出与广告费支出x之间的关系之间的关系相关关系的分类按变量的多少分为:单相关、复相关和偏相关按相关程度分为:完全相关、不完全相关和不相关按相关形式分为:线性相关和非线性相关按相关方向分为:正相关和负相关按相关性质分为:真实相关和虚假相关8.1.2 用相关表、相关图描述相关关系8.1 变量间的关系变量间的关系相关表和相关图相关表是一种反映变量之间相关关系的统计表。将
9、相关表是一种反映变量之间相关关系的统计表。将某一变量按其取值的大小排列,然后再将与其相关某一变量按其取值的大小排列,然后再将与其相关的另一变量的对应值平行排列,便可得到简单的相的另一变量的对应值平行排列,便可得到简单的相关表。如前表关表。如前表8.1所示所示相关图又称散点图。它是以直角坐标系的横轴代表相关图又称散点图。它是以直角坐标系的横轴代表变量变量x,纵轴代表变量,纵轴代表变量Y,将两个变量间相对应的,将两个变量间相对应的变量值用坐标点的形式描绘出来,用来反映两变量变量值用坐标点的形式描绘出来,用来反映两变量之间的相关关系的图形。之间的相关关系的图形。缺点:二者是研究相关关系的直观工具,它
10、们只能缺点:二者是研究相关关系的直观工具,它们只能对现象之间存在的相关关系的方向、形式、密切程对现象之间存在的相关关系的方向、形式、密切程度作大致判断,不能说明具体相关关系的密切程度。度作大致判断,不能说明具体相关关系的密切程度。因此需要计算相关系数。因此需要计算相关系数。8.1.2 用散点图描述相关关系8.1 变量间的关系变量间的关系 完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关 散点图(scatter diagram)不相关不相关不相关不相关不相关不相关 负线性相关负
11、线性相关负线性相关负线性相关负线性相关负线性相关 正线性相关正线性相关正线性相关正线性相关正线性相关正线性相关 非线性相关非线性相关非线性相关非线性相关非线性相关非线性相关 完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关(散点图举例)从下图可以看出,居民的(散点图举例)从下图可以看出,居民的消费支出和可支配收入之间呈现正线性相消费支出和可支配收入之间呈现正线性相关关系关关系 8.1.3 用相关系数度量关系强度8.1 变量间的关系变量间的关系2)相关系数相关系数(correlation coefficient)1.对变量之间关系密切程度的度量对变量之间关系密
12、切程度的度量2.对对两两个个变变量量之之间间线线性性相相关关程程度度的的度度量量称称为为简简单单相相关系数关系数3.反反映映一一个个因因变变量量与与两两个个及及两两个个以以上上变变量量之之间间相相关关程度的统计分析指标称为程度的统计分析指标称为复相关系数。复相关系数。4.偏偏相相关关系系数数是是指指在在多多元元相相关关分分析析中中考考虑虑其其他他变变量量但但假假定定其其保保持持不不变变的的情情况况下下计计算算出出来来的的反反映映两两个个变量之间相关程度的统计分析方法。变量之间相关程度的统计分析方法。5.若若相相关关系系数数是是根根据据总总体体全全部部数数据据计计算算的的,称称为为总总体相关系数
13、,记为体相关系数,记为 6.若若是是根根据据样样本本数数据据计计算算的的,则则称称为为样样本本相相关关系系数数,记为记为 r相关系数的计算公式(记住)相关系数的计算公式(记住)样本相关系数的计算公式或化简为相关系数的性质性质性质1:r 的取值范围是-1,1|r|=1,为完全相关lr=1,为完全正相关lr=-1,为完全负正相关r=0,不存在线线性性相关关系(并不说明不存在关系)-1r0,为负相关0r1,为正相关|r|越趋于1表示关系越强;|r|越趋于0表示关系越弱相关系数的性质性性质质2:r具有对称性。即x与y之间的相关系数和y与x之间的相关系数相等,即rxy=ryx性性质质3:r数值大小与x和
14、y原点及尺度无关,即改变x和y的数据原点及计量尺度,并不改变r数值大小性性质质4:仅仅是x与y之间线性关系的一个度量,它不能用于描述非线性关系。这意为着,r=0只表示两个变量之间不存在线性相关关系,并不说明变量之间没有任何关系性性质质5:r虽然是两个变量之间线性关系的一个度量,却不一定意味着x与y一定有因果关系取值及其意义-1.0+1.00-0.5+0.5完全负相关完全负相关完全负相关完全负相关无线性相关无线性相关无线性相关无线性相关完全正相关完全正相关完全正相关完全正相关负相关程度增加负相关程度增加负相关程度增加负相关程度增加r正相关程度增加正相关程度增加正相关程度增加正相关程度增加相关系数
15、的经验解释1.|r|0.8时,可视为两个变量之间高度相关2.0.5|r|0.8时,可视为中度相关3.0.3|r|0.5时,视为低度相关4.|r|t,拒绝,拒绝H0 若若tt,不能拒绝,不能拒绝H0 8.2 一元线性回归的估计和检验一元线性回归的估计和检验 8.2.1 一元线性回归模型一元线性回归模型 8.2.2 参数的最小二乘估计参数的最小二乘估计 8.2.3 回归直线的拟合优度回归直线的拟合优度 8.2.4 显著性检验显著性检验第 8 章 一元线性回归分析8.2.1 一元线性回归分析8.2 一元线性回归的估计和检验一元线性回归的估计和检验什么是回归分析?什么是回归分析?(regression
16、 analysis)回归分析回归分析是指根据相关关系的具体形态,选择合是指根据相关关系的具体形态,选择合适的数学模型(回归方程),近似地描述变量间适的数学模型(回归方程),近似地描述变量间的平均变化关系的一种统计分析方法。的平均变化关系的一种统计分析方法。回归分析实际上是相关现象间不确定、不规则的回归分析实际上是相关现象间不确定、不规则的数量关系的一般化、规律化。回归分析采用的方数量关系的一般化、规律化。回归分析采用的方法是配合直线或曲线来反映现象之间的一般数量法是配合直线或曲线来反映现象之间的一般数量关系。这条直线或曲线叫关系。这条直线或曲线叫回归直线或回归曲线回归直线或回归曲线,它们的方程
17、称为它们的方程称为回归直线方程或回归曲线方程回归直线方程或回归曲线方程。回归的古典和现代意义1.回归的古典意义回归的古典意义:高尔顿遗传学的回归概念高尔顿遗传学的回归概念父母身高与子女身高的关系父母身高与子女身高的关系:无论高个子或低个子的子女都有向人的平均身高无论高个子或低个子的子女都有向人的平均身高回归的趋势回归的趋势2.回归的现代意义回归的现代意义:一个因变量对若干解释变一个因变量对若干解释变量依存关系的研究量依存关系的研究回归的目的(实质):回归的目的(实质):由固定的自变量去估计因变量的平均值由固定的自变量去估计因变量的平均值相关分析与回归分析的联系简简单单说说:(1)(1)相相关关
18、分分析析是是回回归归分分析析的的基基础础和和前前提提。如如果果缺缺少少相相关关分分析析,没没有有从从定定性性上上说说明明现现象象间间是是否否存存在在相相关关关关系系及及相相关关关关系系的的密密切切程程度度,就就无无法法进进行行回回归分析。归分析。(2)(2)回回归归分分析析是是相相关关分分析析的的深深入入和和继继续续。仅仅仅仅说说明明现现象象间间具具有有密密切切的的相相关关关关系系是是不不够够的的,只只有有进进行行回回归归分分析析,拟拟合合回回归归方方程程,才才可可能能进进行行深深入入分分析和回归预测,相关分析才有实际应用价值。析和回归预测,相关分析才有实际应用价值。回归分析与相关分析的区别回
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 教育学 相关 回归 分析
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【可****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【可****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。