统计案例分析典型例题.doc
《统计案例分析典型例题.doc》由会员分享,可在线阅读,更多相关《统计案例分析典型例题.doc(41页珍藏版)》请在咨信网上搜索。
统计案例分析及典型例题 §11.1 抽样方法 基础自测 1.为了了解所加工的一批零件的长度,抽取其中200个零件并测量了其长度,在这个问题中,总体的一个样本是 . 答案 200个零件的长度 2.某城区有农民、工人、知识分子家庭共计2 004户,其中农民家庭1 600户,工人家庭303户,现要从中抽取容量为40的样本,则在整个抽样过程中,可以用到下列抽样方法:①简单随机抽样,②系统抽样,③分层抽样中的 . 答案 ①②③ 3.某企业共有职工150人,其中高级职称15人,中级职称45人,初级职称90人.现采用分层抽样抽取容量为30的样本,则抽取的各职称的人数分别为 . 答案 3,9,18 4.某工厂生产A、B、C三种不同型号的产品,其相应产品数量之比为2∶3∶5,现用分层抽样方法抽出一个容量为n的样本,样本中A型号产品有16件,那么此样本的容量n= . 答案 80 例1 某大学为了支援我国西部教育事业,决定从2007应届毕业生报名的18名志愿者中,选取6人组成志愿小组.请 用抽签法和随机数表法设计抽样方案. 解 抽签法: 第一步:将18名志愿者编号,编号为1,2,3,…,18. 第二步:将18个号码分别写在18张外形完全相同的纸条上,并揉成团,制成号签; 第三步:将18个号签放入一个不透明的盒子里,充分搅匀; 第四步:从盒子中逐个抽取6个号签,并记录上面的编号; 第五步:所得号码对应的志愿者,就是志愿小组的成员. 随机数表法: 第一步:将18名志愿者编号,编号为01,02,03,…,18. 第二步:在随机数表中任选一数作为开始,按任意方向读数,比如第8行第29列的数7开始,向右读; 第三步:从数7开始,向右读,每次取两位,凡不在01—18中的数,或已读过的数,都跳过去不作记录,依次可得到12,07,15,13,02,09. 第四步:找出以上号码对应的志愿者,就是志愿小组的成员. 例2 某工厂有1 003名工人,从中抽取10人参加体检,试用系统抽样进行具体实施. 解 (1)将每个人随机编一个号由0001至1003. (2)利用随机数法找到3个号将这3名工人剔除. (3)将剩余的1 000名工人重新随机编号由0001至1000. (4)分段,取间隔k==100将总体均分为10段,每段含100个工人. (5)从第一段即为0001号到0100号中随机抽取一个号l. (6)按编号将l,100+l,200+l,…,900+l共10个号码选出,这10个号码所对应的工人组成样本. 例3 (14分)某一个地区共有5个乡镇,人口3万人,其中人口比例为3∶2∶5∶2∶3,从3万人中抽取一个300人 的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程. 解 应采取分层抽样的方法. 3分 过程如下: (1)将3万人分为五层,其中一个乡镇为一层. 5分 (2)按照样本容量的比例随机抽取各乡镇应抽取的样本. 300×=60(人);300×=40(人); 300×=100(人);300×=40(人); 300×=60(人), 10分 因此各乡镇抽取人数分别为60人,40人,100人,40人,60人. 12分 (3)将300人组到一起即得到一个样本. 14分 练习: 一、填空题 1.(安庆模拟)某校高中生共有900人,其中高一年级300人,高二年级200人,高三年级400人,现分层抽取容量为45的样本,那么高一、高二、高三年级抽取的人数分别为 . 答案 15,10,20 2.某牛奶生产线上每隔30分钟抽取一袋进行检验,则该抽样方法为①;从某中学的30名数学爱好者中抽取3人了解学习负担情况,则该抽样方法为②.那么①,②分别为 . 答案 系统抽样,简单随机抽样 3.下列抽样实验中,最适宜用系统抽样的是 (填序号). ①某市的4个区共有2 000名学生,且4个区的学生人数之比为3∶2∶8∶2,从中抽取200人入样 ②某厂生产的2 000个电子元件中随机抽取5个入样 ③从某厂生产的2 000个电子元件中随机抽取200个入样 ④从某厂生产的20个电子元件中随机抽取5个入样 答案 ③ 4.(2013·重庆文)某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查,这种抽样方法是 . 答案 分层抽样法 5.某中学有高一学生400人,高二学生300人,高三学生200人,学校团委欲用分层抽样的方法抽取18名学生进行问卷调查,则下列判断不正确的是 (填序号). ①高一学生被抽到的概率最大 ②高三学生被抽到的概率最大 ③高三学生被抽到的概率最小 ④每名学生被抽到的概率相等 答案 ①②③ 6.某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测,若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是 . 答案 6 7.(天津文,11)一个单位共有职工200人,其中不超过45岁的有120人,超过45岁的有80人.为了调查职工的健康状况,用分层抽样的方法从全体职工中抽取一个容量为25的样本,应抽取超过45岁的职工 人. 答案 10 8.将参加数学竞赛的1 000名学生编号如下0001,0002,0003,…,1000,打算从中抽取一个容量为50的样本,按系统抽样的方法分成50个部分,如果第一部分编号为0001,0002,…,0020,从第一部分随机抽取一个号码为0015,则第40个号码为 . 答案 0795 9.某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人,上级机关为了了解政府机构改革意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,如何抽取? 解 用分层抽样抽取. (1)∵20∶100=1∶5, ∴=2,=14,=4 ∴从副处级以上干部中抽取2人,一般干部中抽取14人,从工人中抽取4人. (2)因副处级以上干部与工人人数较少,可用抽签法从中分别抽取2人和4人;对一般干部可用随机数表法抽取14人. (3)将2人、4人、14人编号汇合在一起就得到了容量为20的样本. 10.某单位有工程师6人,技术员12人,技工18人,要从这些人中抽取一个容量为n的样本.如果采用系统抽样法和分层抽样法抽取,不用剔除个体;如果样本容量增加一个,则在采用系统抽样时,需要在总体中先剔除1个个体,求样本容量n. 解 总体容量为6+12+18=36.当样本容量是n时,由题意知,系统抽样的间隔为,分层抽样的比例是,抽取工程师×6=(人), 抽取技术人员×12=(人), 抽取技工×18=(人). 所以n应是6的倍数,36的约数即n=6,12,18,36. 当样本容量为(n+1)时,在总体中剔除1人后还剩35人,系统抽样的间隔为,因为必须是整数,所以n只能取6,即样本容量为6. 总体分布的估计与总体特征数的估计 基础自测 1.一个容量为20的样本,已知某组的频率为0.25,则该组的频数为 . 答案 5 2.(2008·山东理)右图是根据《山东统计年鉴2007》中的资料作成的1997年至2006年我省城镇居民百户家庭人口数的茎叶图.图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字.从图中可以得到1997年至2006年我省城镇居民百户家庭人口数的平均数为 . 答案 303.6 3.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a,b)是其中的一组,抽查出的个体在该组上的频率为m,该组在频率分布直方图的高为h,则|a-b|= . 答案 4.(2008·山东文,9)从某项综合能力测试中抽取100人的成绩,统计如表,则这100人成绩的标准差为 . 分数 5 4 3 2 1 人数 20 10 30 30 10 答案 5.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁~18岁的男生体重(kg),得到频率分布直方图如下: 根据上图可得这100名学生中体重在[56.5,64.5)的学生人数是 . 答案 40 典型例题: 例1 在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日至30日,评委会把同学们上交 作品的件数按5天一组分组统计,绘制了频率分布直方图(如图所示),已知从左到右各长方形高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答下列问题: (1)本次活动共有多少件作品参加评比? (2)哪组上交的作品数量最多?有多少件? (3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率高? 解 (1)第三组的频率为= 又因为第三组的频数为12,∴参评作品数为=60. (2)根据频率分布直方图,可以看出第四组上交的作品数量最多,共有60×=18(件). (3)第四组的获奖率是=,第六组上交的作品数量为60×=3(件), ∴第六组的获奖率为=,显然第六组的获奖率高. 例4(14分)某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔30 min抽取一包产品,称其重量,分别 记录抽查数据如下: 甲:102, 101, 99, 98, 103, 98, 99; 乙:110, 115, 90, 85, 75, 115, 110. (1)这种抽样方法是哪一种? (2)将这两组数据用茎叶图表示; (3)将两组数据比较,说明哪个车间产品较稳定. 解 (1)因为间隔时间相同,故是系统抽样. 2分 (2)茎叶图如下: 5分 (3)甲车间: 平均值: =(102+101+99+98+103+98+99)=100, 7分 方差:s12=[(102-100)2+(101-100)2+…+(99-100)2]≈3.428 6. 9分 乙车间: 平均值:=(110+115+90+85+75+115+110)=100, 11分 方差:s22=[(110-100)2+(115-100)2+…+(110-100)2]≈228.571 4. 13分 ∵=,s12<s22,∴甲车间产品稳定. 14分 练习: 1.为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得数据整理后,画出频率分布直方图如图所示,已知图中从左到右前三个小组的频率分别是0.1,0.3,0.4,第一小组的频数为5. (1)求第四小组的频率; (2)参加这次测试的学生人数是多少? (3)在这次测试中,学生跳绳次数的中位数落在第几小组内? 解 (1)第四小组的频率=1-(0.1+0.3+0.4)=0.2. (2)设参加这次测试的学生人数是n, 则有n==5÷0.1=50(人). (3)因为0.1×50=5,0.3×50=15,0.4×50=20,0.2×50=10,即第一、第二、第三、第四小组的频数分别为5、15、20、10,所以学生跳绳次数的中位数落在第三小组内. 练习: 一、填空题 1.下列关于频率分布直方图的说法中不正确的是 . ①直方图的高表示取某数的频率 ②直方图的高表示该组上的个体在样本中出现的频率 ③直方图的高表示该组上的个体数与组距的比值 ④直方图的高表示该组上的个体在样本中出现的频率与组距的比值 答案 ①②③ 2.甲、乙两名新兵在同样条件下进行射击练习,每人打5发子弹,命中环数如下:甲:6,8,9,9,8;乙:10,7,7,7,9.则这两人的射击成绩 比 稳定. 答案 甲 乙 4.某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果分成六组:右图是得到的频率分布直方图. 设成绩小于17秒的学生人数占全班总人数的百分比为x,成绩大于等于15秒且小于17秒的学生人数为y,则从频率分布直方图中可分析出x和y分别为 . 答案 0.9, 35 6.甲、乙两名同学在5次体育测试中的成绩统计的茎叶图如图所示,若甲、乙两人的平均成绩 分别是x甲、x乙,则x甲 x乙, 比 稳定. 答案 < 乙 甲 7.(上海,9)已知总体的各个体的值由小到大依次为2,3,3,7,a,b,12,13.7,18.3,20,且总体的中位数为10.5.若要使该总体的方差最小,则a、b的取值分别是 . 答案 10.5、10.5 二、解答题 10.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12. (1)第二小组的频率是多少?样本容量是多少? (2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少? (3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由. 解 (1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小, 因此第二小组的频率为: =0.08. 又因为频率=, 所以样本容量===150. (2)由图可估计该学校高一学生的达标率约为 ×100%=88%. (3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内. 线性回归方程基础自测 1.下列关系中,是相关关系的为 (填序号). ①学生的学习态度与学习成绩之间的关系; ②教师的执教水平与学生的学习成绩之间的关系; ③学生的身高与学生的学习成绩之间的关系; ④家庭的经济条件与学生的学习成绩之间的关系. 答案 ①② 2.为了考察两个变量x、y之间的线性相关关系,甲、乙两同学各自独立地做10次和15次试验,并利用最小二乘法求得回归直线分别为l1和l2.已知在两人的试验中发现变量x的观测数据的平均值恰好相等,都为s,变量y的观测数据的平均值也恰好相等,都为t,那么下列说法中正确的是 (填序号). ①直线l1,l2有交点(s,t) ②直线l1,l2相交,但是交点未必是(s,t) ③直线l1,l2由于斜率相等,所以必定平行 ④直线l1,l2必定重合 答案 ① 3.下列有关线性回归的说法,正确的是 (填序号). ①相关关系的两个变量不一定是因果关系 ②散点图能直观地反映数据的相关程度 ③回归直线最能代表线性相关的两个变量之间的关系 ④任一组数据都有回归直线方程 答案 ①②③ 4.下列命题: ①线性回归方法就是由样本点去寻找一条贴近这些样本点的直线的数学方法; ②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示; ③通过回归直线=+及回归系数,可以估计和预测变量的取值和变化趋势. 其中正确命题的序号是 . 答案 ①②③ 5.已知回归方程为=0.50x-0.81,则x=25时,的估计值为 . 答案 11.69 例1 下面是水稻产量与施化肥量的一组观测数据: 施化肥量 15 20 25 30 35 40 45 水稻产量 320 330 360 410 460 470 480 (1)将上述数据制成散点图; (2)你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?水稻产量会一直随施化肥量的增加而增长吗? 解 (1)散点图如下: (2)从图中可以发现施化肥量与水稻产量具有线性相关关系,当施化肥量由小到大变化时,水稻产量由小变大,图中的数据点大致分布在一条直线的附近,因此施化肥量和水稻产量近似成线性相关关系,但水稻产量只是在一定范围内随着化 肥施用量的增加而增长. 例2 (14分)随着我国经济的快速发展,城乡居民的生活水平不断提高,为研究某市家庭平均收入与月平均生活支出 的关系,该市统计部门随机调查了10个家庭,得数据如下: 家庭编号 1 2 3 4 5 6 7 8 9 10 xi(收入)千元 0.8 1.1 1.3 1.5 1.5 1.8 2.0 2.2 2.4 2.8 yi(支出)千元 0.7 1.0 1.2 1.0 1.3 1.5 1.3 1.7 2.0 2.5 (1)判断家庭平均收入与月平均生活支出是否相关? (2)若二者线性相关,求回归直线方程. 解 (1)作出散点图: 5分 观察发现各个数据对应的点都在一条直线附近,所以二者呈线性相关关系. 7分 (2)= (0.8+1.1+1.3+1.5+1.5+1.8+2.0+2.2+2.4+2.8)=1.74, =(0.7+1.0+1.2+1.0+1.3+1.5+1.3+1.7+2.0+2.5)=1.42, 9分 =≈0.813 6, =1.42-1.74×0.813 6≈0.004 3, 13分 ∴回归方程=0.813 6x+0.004 3. 14分 例3 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨)标准煤的几组对照数据. x 3 4 5 6 y 2.5 3 4 4.5 (1)请画出上表数据的散点图; (2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程=x+; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:3×2.5+4×3+5×4+6×4.5=66.5) 解 (1)散点图如下图: (2)==4.5,==3.5 =3×2.5+4×3+4×5+6×4.5=66.5. =32+42+52+62=86 ∴===0.7 =-=3.5-0.7×4.5=0.35. ∴所求的线性回归方程为=0.7x+0.35. (3)现在生产100吨甲产品用煤 y=0.7×100+0.35=70.35, ∴降低90-70.35=19.65(吨)标准煤. 1.科研人员为了全面掌握棉花新品种的生产情况,查看了气象局对该地区年降雨量与年平均气温的统计数据(单位分别是mm,℃),并作了统计. 年平均气温 12.51 12.84 12.84 13.69 13.33 12.74 13.05 年降雨量 748 542 507 813 574 701 432 (1)试画出散点图; (2)判断两个变量是否具有相关关系. 解 (1)作出散点图如图所示, (2)由散点图可知,各点并不在一条直线附近,所以两个变量是非线性相关关系. 2.在研究硝酸钠的可溶性程度时,对于不同的温度观测它在水中的溶解度,得观测结果如下: 温度(x) 0 10 20 50 70 溶解度(y) 66.7 76.0 85.0 112.3 128.0 由资料看y与x呈线性相关,试求回归方程. 解 =30,==93.6. =≈0.880 9. =-=93.6-0.880 9×30=67.173. ∴回归方程为=0.880 9x+67.173. 3.某企业上半年产品产量与单位成本资料如下: 月份 产量(千件) 单位成本(元) 1 2 73 2 3 72 3 4 71 4 3 73 5 4 69 6 5 68 (1)求出线性回归方程; (2)指出产量每增加1 000件时,单位成本平均变动多少? (3)假定产量为6 000件时,单位成本为多少元? 解 (1)n=6,=21,=426,=3.5,=71, =79,=1 481, ===-1.82. =-=71+1.82×3.5=77.37. 回归方程为=+x=77.37-1.82x. (2)因为单位成本平均变动=-1.82<0,且产量x的计量单位是千件,所以根据回归系数b的意义有: 产量每增加一个单位即1 000件时,单位成本平均减少1.82元. (3)当产量为6 000件时,即x=6,代入回归方程: =77.37-1.82×6=66.45(元) 当产量为6 000件时,单位成本为66.45元. 一、填空题 1.观察下列散点图,则①正相关;②负相关;③不相关.它们的排列顺序与图形对应顺序是 . 答案 a,c,b 2.回归方程=1.5x-15,则下列说法正确的有 个. ①=1.5-15 ②15是回归系数a ③1.5是回归系数a ④x=10时,y=0 答案 1 3.(2009.湛江模拟)某地区调查了2~9岁儿童的身高,由此建立的身高y(cm)与年龄x(岁)的回归模型为=8.25x+60.13,下列叙述正确的是 . ①该地区一个10岁儿童的身高为142.63 cm ②该地区2~9岁的儿童每年身高约增加8.25 cm ③该地区9岁儿童的平均身高是134.38 cm ④利用这个模型可以准确地预算该地区每个2~9岁儿童的身高 答案 ② 4.三点(3,10),(7,20),(11,24)的回归方程是 . 答案 =1.75x+5.75 5.某人对一地区人均工资x(千元)与该地区人均消费y(千元)进行统计调查,y与x有相关关系,得到回归直线方程=0.66x+1.562.若该地区的人均消费水平为7.675千元,估计该地区的人均消费额占人均工资收入的百分比约为 . 答案 83% 6.某化工厂为预测产品的回收率y,需要研究它和原料有效成分含量x之间的相关关系,现取8对观测值,计算,得=52, =228, =478, =1 849,则其线性回归方程为 . 答案 =11.47+2.62x 7.有下列关系:①人的年龄与他(她)拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树木,其断面直径与高度之间的关系.其中,具有相关关系的是 . 答案 ①③④ 8.已知关于某设备的使用年限x与所支出的维修费用y(万元),有如下统计资料: 使用年限x 2 3 4 5 6 维修费用y 2.2 3.8 5.5 6.5 7.0 若y对x呈线性相关关系,则回归直线方程=x+表示的直线一定过定点 . 答案 (4,5) 二、解答题 9.期中考试结束后,记录了5名同学的数学和物理成绩,如下表: 学生 学科 A B C D E 数学 80 75 70 65 60 物理 70 66 68 64 62 (1)数学成绩和物理成绩具有相关关系吗? (2)请你画出两科成绩的散点图,结合散点图,认识(1)的结论的特点. 解 (1)数学成绩和物理成绩具有相关关系. (2)以x轴表示数学成绩,y轴表示物理成绩,可得相应的散点图如下: 由散点图可以看出,物理成绩和数学成绩对应的点不分散,大致分布在一条直线附近. 10.以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据: 房屋面积x(m2) 115 110 80 135 105 销售价格y(万元) 24.8 21.6 18.4 29.2 22 (1)画出数据对应的散点图; (2)求线性回归方程,并在散点图中加上回归直线. 解 (1)数据对应的散点图如图所示: (2)=109,=23.2,=60 975, =12 952, =≈0.196 2 =-≈1.814 2 ∴所求回归直线方程为 =0.196 2x+1.814 2. 11.某公司利润y与销售总额x(单位:千万元)之间有如下对应数据: x 10 15 17 20 25 28 32 y 1 1.3 1.8 2 2.6 2.7 3.3 (1)画出散点图; (2)求回归直线方程; (3)估计销售总额为24千万元时的利润. 解 (1)散点图如图所示: (2)=(10+15+17+20+25+28+32)=21, =(1+1.3+1.8+2+2.6+2.7+3.3)=2.1, =102+152+172+202+252+282+322=3 447, =10×1+15×1.3+17×1.8+20×2+25×2.6+28×2.7+32×3.3=346.3, ==≈0.104, =-=2.1-0.104×21=-0.084, ∴=0.104x-0.084. (3)把x=24(千万元)代入方程得, =2.412(千万元). ∴估计销售总额为24千万元时,利润为2.412千万元. 12.某种产品的广告费支出x与销售额y(单位:百万元)之间有如下对应数据: x 2 4 5 6 8 y 30 40 60 50 70 (1)画出散点图; (2)求回归直线方程; (3)试预测广告费支出为10百万元时,销售额多大? 解 (1)根据表中所列数据可得散点图如下: (2)列出下表,并用科学计算器进行有关计算: i 1 2 3 4 5 xi 2 4 5 6 8 yi 30 40 60 50 70 xiyi 60 160 300 300 560 因此,==5,= =50, =145, =13 500, =1 380. 于是可得:===6.5; =-=50-6.5×5=17.5. 因此,所求回归直线方程为:=6.5x+17.5. (3)根据上面求得的回归直线方程,当广告费支出为10百万元时,=6.5×10+17.5=82.5(百万元),即这种产品的销售收入大约为82.5百万元. §11.4 统计案例 基础自测 1.对有线性相关关系的两个变量建立的回归直线方程=+x中,回归系数与0的大小关系为 .(填序号) ①大于或小于 ②大于 ③小于 ④不小于 答案 ① 2.如果有90%的把握说事件A和B有关系,那么具体计算出的数据2 2.706.(用“>”,“<”,“=”填空) 答案 > 3.对两个变量y与x进行回归分析,分别选择不同的模型,它们的相关系数r如下,其中拟合效果最好的模型是 . ①模型Ⅰ的相关系数r为0.98 ②模型Ⅱ的相关系数r为0.80 ③模型Ⅲ的相关系数r为0.50 ④模型Ⅳ的相关系数r为0.25 答案 ① 4.下列说法中正确的有:①若r>0,则x增大时,y也相应增大;②若r<0,则x增大时,y也相应增大;③若r=1或r=-1,则x与y的关系完全对应(有函数关系),在散点图上各个点均在一条直线上 . 答案 ①③ 例1 (14分)调查339名50岁以上人的吸烟习惯与患慢性气管炎的情况,获数据如下: 患慢性气管炎 未患慢性气管炎 总计 吸烟 43 162 205 不吸烟 13 121 134 合计 56 283 339 试问:(1)吸烟习惯与患慢性气管炎是否有关? (2)用假设检验的思想给予证明. (1)解 根据列联表的数据,得到 2= 2分 ==7.469>6.635 6分 所以有99%的把握认为“吸烟与患慢性气管炎有关”. 9分 (2)证明 假设“吸烟与患慢性气管炎之间没有关系”,由于事件A={2≥6.635}≈0.01,即A为小概率事件,而小概率事件发生了,进而得假设错误,这种推断出错的可能性约有1%. 14分 例2 一台机器使用时间较长,但还可以使用.它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有 缺点零件的多少,随机器运转的速度而变化,下表为抽样试验结果: 转速x(转/秒) 16 14 12 8 每小时生产有缺 点的零件数y(件) 11 9 8 5 (1)对变量y与x进行相关性检验; (2)如果y与x有线性相关关系,求回归直线方程; (3)若实际生产中,允许每小时的产品中有缺点的零件最多为10个,那么,机器的运转速度应控制在什么范围内? 解 (1)=12.5, =8.25, =438,4=412.5, =660,=291, 所以r= = =≈≈0.995 4. 因为r>r0.05,所以y与x有很强的线性相关关系. (2)=0.728 6x-0.857 1. (3)要使≤100.728 6x-0.857 1≤10, 所以x≤14.901 3. 所以机器的转速应控制在14.901 3转/秒以下. 例3 下表是某年美国旧轿车价格的调查资料,今以x表示轿车的使用年数,y表示相应的年均价格,求y关于x的回归 方程. 使用年数x 1 2 3 4 5 6 7 8 9 10 年均价格 y(美元) 2 651 1 943 1 494 1 087 765 538 484 290 226 204 解 作出散点图如图所示. 可以发现,各点并不是基本处于一条直线附近,因此,y与x之间应是非线性相关关系.与已学函数图象比较,用=e 来刻画题中模型更为合理,令=ln,则=x+,题中数据变成如下表所示: x 1 2 3 4 5 6 7 8 9 10 z 7.883 7.572 7.309 6.991 6.640 6.288 6.182 5.670 5.421 5.318 相应的散点图如图所示,从图中可以看出,变换的样本点分布在一条直线附近,因此可以用线性回归方程拟合. 由表中数据可得r≈-0.996.|r|>r0.05.认为x与z之间具有线性相关关系,由表中数据得≈-0.298,≈8.165,所以=-0.298x+8.165,最后回代=ln,即=e-0.298x+8.165为所求. 1.某班主任对全班50名学生学习积极性和对待班级工作的态度进行了调查,统计数据如下表所示: 积极参加班级工作 不太主动参加班级工作 合计 学习积极性高 18 7 25 学习积极性一般 6 19 25 合计 24 26 50 (1)如果随机抽查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是多少?抽到不太主动参加班级工作且学习积极性一般的学生的概率是多少? (2)试运用独立性检验的思想方法分析:学生的学习积极性与对待班级工作的态度是否有关系?说明理由. 解 (1)随机抽查这个班的一名学生,有50种不同的抽查方法,由于积极参加班级工作的学生有18+6=24人,所以有24种不同的抽法,因此由古典概型的计算公式可得抽到积极参加班级工作的学生的概率是P1==,又因为不太主动 参加班级工作且学习积极性一般的学生有19人,所以抽到不太主动参加班级工作且学习积极性一般的学生的概率是P2=. (2)由统计量的计算公式得=≈11.538,由于11.538>10.828,所以可以有99.9%的把握认为“学生的学习积极性与对待班级工作的态度有关系”. 2.某个体服装店经营某种服装,一周内获纯利y(元)与该周每天销售这种服装的件数x之间的一组数据如下: x 3 4 5 6 7 8 9 y 66 69 73 81 89 90 91 已知=280, =45 309, =3 487,此时r0.05=0.754. (1)求,; (2)判断一周内获纯利润y与该周每天销售件数x之间是否线性相关,如果线性相关,求出回归直线方程. 解 (1)=(3+4+5+6+7+8+9)=6, = (66+69+73+81+89+90+91)≈79.86. (2)根据已知=280, =45 309, =3 487, 得相关系数 r=≈0.973. 由于0.973>0.754,所以纯利润y与每天销售件数x之间具有显著线性相关关系. 利用已知数据可求得回归直线方程为 =4.746x+51.386. 3.某种书每册的成本费y(元)与印刷册数x(千册)有关,经统计得到数据如下: x 1 2 3 5 10 20 30 50 100 200 y 10.15 5.52 4.08 2.85 2.11 1.62 1.41 1.30 1.21 1.15 检验每册书的成本费y与印刷册数的倒数之间是否具有线性相关关系,如有,求出y对x的回归方程. 解 首先作变量置换,令u=,题目所给数据变成如下表所示的10对数据: u 1 0.5 0.33 0.2 0.1 0.05 0.03 0.02 0.01 0.005 y 10.15 5.52 4.08 2.85 2.11 1.62 1.41 1.30 1.21 1.15 然后作相关性检验.经计算得r≈0.999 8>0.75,从而认为u与y之间具有线性相关关系. 由公式得≈1.125,≈8.973, 所以=1.125+8.973u, 最后回代u=, 可得=1.125+, 这就是题目要求的y对x的回归曲线方程.回归曲线的图形如图所示,它是经过平移的反比例函数图象的一个分支. 一、填空题 1.对于独立性检验,下列说法中正确的是 . ①的值越大,说明两事件相关程度越大 ②的值越小,说明两事件相关程度越小 ③≤2.706时,有90%的把握说事件A与B无关 ④>6.635时,有99%的把握说事件A与B有关 答案 ①②④ 2.工人月工资y(元)依劳动生产率x(千元)变化的回归方程为=50+80x,下列判断正确的是- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 案例 分析 典型 例题
咨信网温馨提示:
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【天****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【天****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【天****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【天****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
关于本文