用样本频率分布估计总体分布PPT.ppt
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 样本 频率 分布 估计 总体 PPT
- 资源描述:
-
2.2.1 2.2.1 用样本的频率分用样本的频率分布估计总体分布布估计总体分布 我们用简单随机抽样、系统抽样、分层我们用简单随机抽样、系统抽样、分层抽样的方法收集样本数据后,就可以通过样抽样的方法收集样本数据后,就可以通过样本研究总体。本研究总体。用样本估计总体的两种情况:用样本估计总体的两种情况:用样本的频率分布估计总体分布用样本的频率分布估计总体分布用样本的数字特征(平均数、标准差等)用样本的数字特征(平均数、标准差等)估计总体的数字特征估计总体的数字特征 复习回顾复习回顾频数:频数:不分组时,数据中某个数据出现的次数不分组时,数据中某个数据出现的次数 分组时,一个组内的数据的个数分组时,一个组内的数据的个数频率:频率:极差:极差:最大数最大数-最小数最小数分组分组频数频数频率频率频率频率/组距组距频率分布表:频率分布表:知识探究(一):频率分布表知识探究(一):频率分布表 某某市政府为了节约生活用水,计划在市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确本市试行居民生活用水定额管理,即确定一个居民月用水量标准定一个居民月用水量标准a a,用水量不,用水量不超过超过a a的部分按平价收费,超出的部分按平价收费,超出a a的部分的部分按议价收费按议价收费.问题问题1 1:如果希望大部分居民的日常生活如果希望大部分居民的日常生活 不受影响,那么标准不受影响,那么标准a a定为多少比较合理?定为多少比较合理?问题问题2 2:为了较为合理的确定标准:为了较为合理的确定标准a a,需要做,需要做 哪些工作?哪些工作?通过抽样调查,获得通过抽样调查,获得100100位居民位居民20072007年的月年的月均用水量如下表(单位:均用水量如下表(单位:t t):):3.1 2.5 2.0 2.03.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 1.5 1.0 1.6 1.8 1.9 1.63.4 2.6 2.2 2.23.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 1.5 1.2 0.2 0.4 0.3 0.43.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.83.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.83.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.13.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.13.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.33.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.33.0 2.9 2.4 2.43.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 1.9 1.3 1.4 1.8 0.7 2.02.5 2.8 2.3 2.3 1.8 1.3 1.32.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 1.6 0.9 2.32.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.42.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.42.5 2.6 2.3 2.1 1.6 1.0 1.02.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 1.7 0.8 2.42.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.22.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2问题问题3:这些数字告诉了我们什么信息?这些数字告诉了我们什么信息?我们可以看出,样本数据中的最大值我们可以看出,样本数据中的最大值4.34.3和最小值,其他数据在和最小值,其他数据在0.20.24.34.3之间之间分析数据的基本方法:分析数据的基本方法:用图画出来用图画出来 用表格重新排列用表格重新排列1、借助于图:、借助于图:频率分布直方图、频率分布折线图、频率分布直方图、频率分布折线图、茎叶图茎叶图两个目的两个目的从数据中提取信息从数据中提取信息 利用图形传递信息利用图形传递信息2、借助于表格:、借助于表格:频率分布表频率分布表两个目的两个目的 改变数据的排列方式改变数据的排列方式提供解释数据的新方式提供解释数据的新方式第二步:确定组距,第二步:确定组距,组数组数组距组距=每个小组两个每个小组两个端点的差端点的差.组数组数=极差极差组距组距 (取整数)(取整数)探究一探究一 频率分布表频率分布表(4.4.1 10.5=8.20.5=8.2将将8.28.2取整,组数取整,组数=9=9,组距组距=0.5=0.5思考思考1:上述:上述100个数据的个数据的最小值和最大值分别是多最小值和最大值分别是多少?少?第一步:求极差第一步:求极差思考思考2:分成多少组:分成多少组合适?合适?如果将上述如果将上述100100个数据按组个数据按组距为距为0.50.5进行分组,那么这进行分组,那么这些数据共分为多少组?些数据共分为多少组?极差:极差:4.3-0.2=4.1512组组第四步:列频率第四步:列频率 分布表分布表探究一探究一 频率分布表频率分布表思考思考3:各组数据的取值范:各组数据的取值范围如何设定?围如何设定?第三步:确定端第三步:确定端点,将数据分组点,将数据分组 各组均为左开右闭各组均为左开右闭区间,最后一个闭区间,最后一个闭区间区间思考思考4:如何统计各:如何统计各族中的频数、频率?族中的频数、频率?00,0.50.5),),0.50.5,1 1),),11,1.51.5),),44,4.5.4.5.分分 组组 频数频数 频率频率 频率频率/组距组距 0 0,0.50.5)4 0.04 0.08 4 0.04 0.08 0.5 0.5,1 1)8 0.08 0.168 0.08 0.16 1 1,1.51.5)15 0.15 0.3015 0.15 0.30 1.5 1.5,2 2)22 0.22 0.4422 0.22 0.44 2 2,2.52.5)25 0.25 0.5025 0.25 0.50 2.5 2.5,3 3)14 0.14 0.2814 0.14 0.28 3 3,3.53.5)6 0.06 0.126 0.06 0.12 3.5 3.5,4 4)4 0.04 0.084 0.04 0.08 4 4,4.5 2 0.02 0.044.5 2 0.02 0.04 合计合计 100 1.00 2100 1.00 2探究(二):画频率分布直方图探究(二):画频率分布直方图 月均用水量月均用水量/t频率频率组距组距0.50.50.40.40.30.30.20.20.10.10.5 1 1.5 2 2.5 3 3.5 4 4.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O第一步:画直角坐标系:第一步:画直角坐标系:x轴为数据单位,轴为数据单位,y轴为频率轴为频率/组距组距第二步:在第二步:在x轴上均匀标出各组分点,轴上均匀标出各组分点,在在y轴上标出单位长度轴上标出单位长度第三步:以组距为宽,各组的频率第三步:以组距为宽,各组的频率/组距为高,组距为高,分别画出各组对应的长方形分别画出各组对应的长方形 问题问题1 1:频率分布直方图中各小长方形:频率分布直方图中各小长方形的宽度和高度在数量上有何特点?的宽度和高度在数量上有何特点?月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O宽度:组距宽度:组距高度:高度:频率频率组距组距2 频率分布直方图频率分布直方图的意义的意义 问题问题2 2:频率分布直方图中各小长方形的:频率分布直方图中各小长方形的面积表示什么?各小长方形的面积之和面积表示什么?各小长方形的面积之和为多少?为多少?各小长方形的面积各小长方形的面积=各小组的各小组的频率频率各小长方形的面积之和各小长方形的面积之和=1=1月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O宽度:组距宽度:组距高度:高度:频率频率组距组距3 3 分析例题:频率分布直方图非常直观分析例题:频率分布直方图非常直观地表明了样本数据的分布情况,使我们地表明了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数能够看到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示出据模式,但原始数据不能在图中表示出来来.你能根据上述频率分布直方图指出居你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?民月均用水量的一些数据特点吗?月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O(1 1)居民月均用水量的分布是)居民月均用水量的分布是“山峰山峰”状的,而状的,而且是且是“单峰单峰”的;的;(2 2)大部分居民的月均用水量集中在一个中间值)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;附近,只有少数居民的月均用水量很多或很少;(3 3)居民月均用水量的分布有一定的对称性等)居民月均用水量的分布有一定的对称性等.月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O思考:对一组给定的样本数据,频率分思考:对一组给定的样本数据,频率分布直方图的外观形状与哪些因素有关?布直方图的外观形状与哪些因素有关?在居民月均用水量样本中,你能以在居民月均用水量样本中,你能以1 1为组为组距画频率分布直方图吗?距画频率分布直方图吗?与分组数(或组距)及坐标系的单位长与分组数(或组距)及坐标系的单位长度有关度有关.月均用水量月均用水量/t频率频率组距组距0.40.40.30.30.20.20.10.11 2 3 4 5 1 2 3 4 5 O频率分布直方图如下频率分布直方图如下:月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5在频率分布直方图中在频率分布直方图中取取各小长方形上端的中点各小长方形上端的中点用折线依次连接各中点用折线依次连接各中点得到频率分布折线图得到频率分布折线图用样本频分布估计总体分布用样本频分布估计总体分布 上上例例的的样样本本容容量量为为100,如如果果增增至至1000,其其频频率率分分布布直直方方图图的的情情况况会会有有什什么么变变化化?假如增至假如增至10000呢?呢?总体密度曲线总体密度曲线频率频率组距组距月均用月均用水量水量/tab (图中阴影部分的面积,表示总体在(图中阴影部分的面积,表示总体在某个区间某个区间(a,b)内取值的百分比)。内取值的百分比)。当样本容量无限增大,分组的组距无限缩小,那么当样本容量无限增大,分组的组距无限缩小,那么频率分布折线图就会无限接近一条光滑曲线频率分布折线图就会无限接近一条光滑曲线总体密总体密度曲线度曲线总体密度曲线总体密度曲线 用用样样本本分分布布直直方方图图去去估估计计相相应应的的总总体体分分布布时时,一一般般样样本本容容量量越越大大,频频率率分分布布直直方方图图就就会会无无限限接接近近总总体体密密度度曲曲线线,就就越越精精确确地地反反映映了了总总体体的的分分布布规规律律,即即越越精精确确地地反反映映了了总总体体在在各各个个范范围围内内取取值值百分比。百分比。总总体体密密度度曲曲线线反反映映了了总总体体在在各各个个范范围围内内取取值值的的百百分分比比,精精确确地地反反映映了了总总体体的的分分布布规规律律。是是研研究究总总体分布的工具体分布的工具.总体密度曲线总体密度曲线茎茎 叶叶 图图 某赛季甲、乙两名篮球运动员每场比赛得分的某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:原始记录如下:(1)甲运动员得分甲运动员得分:13,51,23,8,26,38,16,33,14,28,39(2)乙运动员得分:乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39 甲甲 乙乙 8 0 4 6 3 1 2 5 3 6 8 2 5 4 3 8 9 3 1 6 1 6 7 9 4 4 9 1 5 0 (1)甲甲:8,13,16,14,23,26,28,38,33,39,51。(2)乙:乙:12,15,24,25,31,36,31,36,37,39,44,49,50,茎叶图茎叶图 当样本数据较少时,用茎叶当样本数据较少时,用茎叶图表示数据的效果较好,它不但图表示数据的效果较好,它不但可以保留所有的信息,而且可以保留所有的信息,而且 可以可以随时记录,给数据的记录和表示随时记录,给数据的记录和表示都方便。都方便。小小 结结 图形图形 优点优点 缺点缺点频率分布频率分布 1)易表示大量数据)易表示大量数据 丢失一些丢失一些直方图直方图 2)直观地表明分布地)直观地表明分布地 情况情况 信息信息 1)无信息损失)无信息损失 只能处理样本只能处理样本 茎叶图茎叶图 2)随时记录方便记录和表示)随时记录方便记录和表示 容量较小数据容量较小数据理论迁移理论迁移 例例1 1 某地区为了了解知识分子的年龄结构,某地区为了了解知识分子的年龄结构,随机抽样随机抽样5050名,其年龄分别如下:名,其年龄分别如下:42 42,3838,2929,3636,4141,4343,5454,4343,3434,4444,40 40,5959,3939,4242,4444,5050,3737,4444,4545,2929,48 48,4545,5353,4848,3737,2828,4646,5050,3737,4444,42 42,3939,5151,5252,6262,4747,5959,4646,4545,6767,53 53,4949,6565,4747,5454,6363,5757,4343,4646,58.58.(1)(1)列出样本频率分布表;列出样本频率分布表;(2)(2)画出频率分布直方图;画出频率分布直方图;(3)(3)估计年龄在估计年龄在32325252岁的知识分子所占的比例岁的知识分子所占的比例约是多少约是多少.(1)(1)极差为极差为67-28=3967-28=39,取组距为,取组距为5 5,分为,分为8 8组组.分分 组组 频数频数 频率频率 频率频率/组距组距 27 27,3232)3 0.06 0.0123 0.06 0.012 32 32,3737)3 0.06 0.0123 0.06 0.012 37 37,4242)9 0.18 0.0369 0.18 0.036 42 42,4747)16 0.32 0.06416 0.32 0.064 47 47,5252)7 0.14 0.0287 0.14 0.028 52 52,5757)5 0.10 0.0205 0.10 0.020 57 57,6262)4 0.08 0.0164 0.08 0.016 62 62,6767)3 0.06 0.0123 0.06 0.012 合合 计计 50 1.00 0.20050 1.00 0.200样本频率分布表:样本频率分布表:(2 2)样本频率分布直方图:)样本频率分布直方图:年龄年龄0.060.060.050.050.040.040.030.030.020.020.010.0127 32 37 42 47 52 57 62 6727 32 37 42 47 52 57 62 67频率频率组距组距O(3 3)因为)因为0.06+0.18+0.32+0.14=0.70.06+0.18+0.32+0.14=0.7,故年龄在故年龄在32325252岁的知识分子约占岁的知识分子约占70%.70%.练习巩固练习巩固 1 有一个容量为有一个容量为50的样本数据的分组的样本数据的分组及各组的频数如下:及各组的频数如下:12.5,15.5)3 24.5,27.5)1015.5,18.5)8 27.5,30.5)518.5,21.5)9 30.5,33.5)421.5,24.5)11列出样本的频率分布表和画出频率列出样本的频率分布表和画出频率分布直方图;分布直方图;根据样本的频率分布估计,小于根据样本的频率分布估计,小于30.5的数据约占多少?的数据约占多少?解解:组距为组距为3 3 分组分组 频数频数 频率频率 频率频率/组距组距12.5,15.5)315.5,18.5)818.5,21.5)921.5,24.5)1124.5,27.5)1027.5,30.5)530.5,33.5)40.060.160.180.220.200.100.080.0200.0530.0600.0730.0670.0330.027频率分布直方图如下:频率分布直方图如下:频率频率组距组距0.0100.0200.0300.0400.05012.5 15.50.0600.070练习:某中学高一(练习:某中学高一(2)班甲,乙两)班甲,乙两名同学自高中以来每场数学考试成名同学自高中以来每场数学考试成绩情况如下:绩情况如下:甲的得分:甲的得分:95,81,75,91,86,89,71,65,76,88,94乙的得分:乙的得分:83,86,93,99,88,96,98,98,79,85,97画出两人数学成绩茎叶图,请根据画出两人数学成绩茎叶图,请根据茎叶图对两人的成绩进行比较。茎叶图对两人的成绩进行比较。课堂小结课堂小结表示样本分布的方法:表示样本分布的方法:(1)频率分布表)频率分布表(2)频率分布图直方图)频率分布图直方图(3)频率分布折线图)频率分布折线图(4)茎叶图)茎叶图展开阅读全文
咨信网温馨提示:1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。




用样本频率分布估计总体分布PPT.ppt



实名认证













自信AI助手
















微信客服
客服QQ
发送邮件
意见反馈



链接地址:https://www.zixin.com.cn/doc/2292154.html