统计概率讲义.doc
《统计概率讲义.doc》由会员分享,可在线阅读,更多相关《统计概率讲义.doc(35页珍藏版)》请在咨信网上搜索。
1、临夏志成中学985班统计概率讲义统计学与概率论的区别与联系区别:统计学反应已经发生的事实的结果,概率论研究未来发生的随机事件的可能性联系:概率论以统计学的研究为基础统计学 普查收集数据 简单随机抽样抽样调查 分层抽样 系统抽样 统 茎叶图 整理数据 频率分布直方图计 集中分析 样本分析 学 分析数据 离散分析 总体估计 线性回归 应用数据 独立性检验一、收集数据 1.普查:需要耗费大量的人力、物力、财力,一般在总体很少时采用 2.抽样调查:从调查的总体中抽取一部分个体组成一个样本进行研究 其中样本中含有的个体数称为该样本的样本容量 简单随机抽样 适用条件:总体数较少,且没有明显的结构差异 常用
2、方法:随机数表法,抽签法,抓阄法 例:用随机数表从300个调查对象中抽出10个个体个体进行研究 随机数表如下:582146697521520365412862541231023203321003320015845975102584769254106350215846202158214446258429702158036489320125412547021则抽取出的10个个体的编号为 分层抽样 适用条件:总体数较多,且有明显的结构差异 本质:样本中各层次的比例与总体中各层次的比例相同 例:志成中学从小学600,初中300,高中100抽取20人进行校长访谈,则分别抽取的人数为 系统抽样 适用条件:
3、总体数很多,无明显结构差异 操作步骤: 第一步:编号,将总体中所有的个体从1开始编号,一直到N(N为最后一个人编号) 第二步:确定组数,样本容量n即为组数 第三步:确定间隔T(此步较为重要):即T为N除以n的商的整数部分,不管小数部分多大,只取整数 第四步:分组,从编号1开始,每T个个体构成一组,共n组,多余的人省略 第五步:在第一组中抽取:采取随机抽样的方法抽取到编号为的个体 第六步:抽取样本:在剩下的n-1组中每组只抽取一个个体,遵循以下原则: 编号分别为: 例:从320个学生中采用系统抽样的方法抽取10个学生参加篮球赛,请你写出一组满足条件的学生编号: 例2:志成中学840人参加野外宿营
4、,其中编号为1-360的360人在I区宿营,依次下来280人在A区,其余人在B区,先采用系统抽样的方法抽取28位同学作为区安全员,若在第一组中抽到的编号为12,则三区的区安全员人数分别为 最后需要特别强调的是,不管采用哪一种抽样方法,每个个体被抽到的概率始终是相等的。二、整理数据 采用抽样方法收集的数据比较杂乱,需要进行整理,是数据有序,目前比较常用的两种方法:茎叶图,频率分布直方图 1.茎叶图 适用条件:样本容量较少 优势:保留了原始数据;便于比较两个样本 操作:选择合适的数作为茎,茎确定后,将对应的数写到前面或后面作为叶例:(2015年全国卷2)某公司为了解用户对其产品的满意度,从,两地区
5、分别随机调查了20个用户,得到用户对产品的满意度评分如下:A地区:62 73 81 92 95 85 74 64 53 76 78 86 95 66 97 78 88 82 76 89B地区:73 83 62 51 91 46 53 73 64 82 93 48 65 81 74 56 54 76 65 79()根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,得出结论即可);()根据用户满意度评分,将用户的满意度从低到高分为三个等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意记事件C:“A地区
6、用户的满意度等级高于B地区用户的满意度等级”假设两地区用户的评价结果相互独立根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率2.频率分布直方图 适用条件:样本容量较大 不足:丢失了原有数据,只能保留数据的大致范围 操作步骤: 第一步:求极差:收集得到的数据中的最大值-最小值=极差L 第二步:确定组距d,根据收集的数据选择合适的数据,以各组中含有的个体数差异不要过大为原则 第三步:确定组数n:与系统抽样不同的是,系统抽样只取商的整数,而在频率分布直方图这儿,不管商的小数部分有多小,我们都要给整数部分+1,为什么呢?例:极差L:20.4,组距d:5则组数n=5() 第四步:列频率分
7、布表(如下) 分组频数累计频数频率合计样本容量 1 说明所谓频数累计,在整理数据时,对于某个数据,该数据属于哪一组,则改组的频数增加1频数/样本容量;频数=样本容量*频率 样本容量=频数/频率频数之和为样本容量,频率之和为1 第五步:根据频率分布表做出频率分布直方图频率组距分组说明:标准的频率分布直方图纵坐标应该为频率组距,但需注意高考题目中给出的直方图中纵坐标可能为频率或者频数,一定注意观察纵坐标表示。对于标准的频率分布直方图,每一段直方的面积表示该组的频率频率之和为注意频率分布表与频率分布直方图的区别于联系(2014年广东卷)随机观测生产某种零件的某工厂25名工人的日加工零件数(单位:件)
8、,获得数据如下:根据上述数据得到样本的频率分布表如下:(1)确定样本频率分布表中和的值;(2)根据上述频率分布表,画出样本频率分布直方图;(3)根据样本频率分布直方图,求在该厂任取4人,至少有1人的日加工零件数落在区间(30,50的概率。例:某班同学利用国庆节进行社会实践,对岁的人群随机抽取人进行了一次生活习惯是否符合低碳观念的调查,若生活习惯符合低碳观念的称为“低碳族”,否则称为“非低碳族”,得到如下统计表和各年龄段人数频率分布直方图:()补全频率分布直方图并求、的值;()从岁年龄段的“低碳族”中采用分层抽样法抽取人参加户外低碳体验活动,其中选取人作为领队,记选取的名领队中年龄在岁的人数为,
9、求的分布列和期望。例(2013年全国2)经销商经销某种农产品,在一个销售季度内,每售出1 t该产品获利润500元,未售出的产品,每1 t亏损300元根据历史资料,得到销售季度内市场需求量的频率分布直方图,如图所示经销商为下一个销售季度购进了130 t该农产品以X(单位:t,100X150)表示下一个销售季度内的市场需求量,T(单位:元)表示下一个销售季度内经销该农产品的利润(1)将T表示为X的函数;(2)根据直方图估计利润T不少于57 000元的概率;(3)在直方图的需求量分组中,以各组的区间中点值代表该组的各个值,并以需求量落入该区间的频率作为需求量取该区间中点值的概率(例如:若需求量X10
10、0,110),则取X105,且X105的概率等于需求量落入100,110)的频率),求T的数学期望例:(2016年全国卷1)某公司计划购买2台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:以这100台机器更换的易损零件数的频率代替1台机器更换的易损零件数发生的概率,记表示2台机器三年内共需更换的易损零件数,表示购买2台机器的同时购买的易损零件数.(I)求的分布
11、列;(II)若要求,确定的最小值;(III)以购买易损零件所需费用的期望值为决策依据,在与之中选其一,应选用哪个?三、分析数据对数据进行整理后,我们对样本的数据进行分析,并用对样本数据的分析估计总体的趋势集中分析集中分析反映样本数据的集中程度,主要有以下指标众数:样本数据中最多的数I、对于茎叶图或者保留了原始数据的样本,众数即为最多的数II、对于频率分布直方图,众数为频率最大(直方最高)组的组中点值中位数:样本数据最中间的数I、对于茎叶图或者保留了原始数据的样本,首先将数据按照从小到大或者从大到小的顺序进行排列,当数据共有奇数个时,最中间的那个数为该组数据的中位数;当数据共有偶数个时,最中间两
12、个数之和的一半为该组数据的中位数II、对于频率分布直方图,中位数为使得该数两边的频率分别为的0.0050.0100.0200.0300.0350.0150.025那个数,具体操作见例:临夏志成中学高中生的体重频率分步直方图如左图所示,则该校学生体重的中位数为 40 50 60 70 80 90 体重(kg)分析:中位数是中间的数,在频率分布直方图中,中位数两端的频率相等,均为,第一组的频率为第二组的频率为前两组频率和为第三组的频率为前三组频率和为也就是说,中位数应该在第三组之中,且频率应该为即第三组中所占的面积为,令底长为,则,即所以中位数为平均数I、对于茎叶图或者保留了原始数据的样本,平均数
13、为算数平均数,即II、对于频率分布直方图,平均数为加权平均数,为各组数的组中点值与该组的频率(即直方的面积)乘积之和,即例:以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分)已知甲组数据的中位数为,乙组数据的平均数为,则的值分别为 离散分析:分析数据的离散程度或者波动程度,主要指标有:极差:极差即样本的最大值与最小值之差方差:方差是反映离散程度最佳指标,方差大,离散程度相对大一些,或者说数据相对不太稳定,波动性较大I、对于茎叶图或者保留了原始数据的样本,方差为:变式:例:(2013年全国卷1)现有个数,其平均数是,且这个数的平方和是,那么这个数组的方差是( )A B C
14、 DII、对于频率分布直方图,方差的计算方式较为复杂,但和几乎一样,先按照前面讲的公式计算平均数,在按照下列公式计算方差:(为各组的组中间值)为各组对应的频率标准差:不管哪一种情况,标准差为方差的算术平方根:标准差例(2014年全国1卷)从某企业的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如下频率分布直方图:求这500件产品质量指标值的样本平均数和样本方差(同一组数据用该区间的中点值作代表);同时还需要强调的是,希望各位同学会对茎叶图做出相应的分析,具体的可以详见课本必修第页,一般从离散和集中两个角度进行。例:甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如
15、图所示,则( ) 甲的成绩的平均数小于乙的成绩的平均数 甲的成绩的中位数等于乙的成绩的中位数 甲的成绩的方差小于乙的成绩的方差 甲的成绩的极差小于乙的成绩的极差四、运用数据:.线性回归(注意非线性回归的线性转换) 线性回归分析两个变量间的线性关系:一个为自变量,另一个为因变量 线性关系的衡量:(散点图从图像角度,相关系数从代数角度分别进行衡量)1)散点图:以自变量的值为横坐标,对应的因变量的值为纵坐标,在平面直角坐标系标出所有对应的点形成的图像 I.当所有点分布在从左下到右上的区域时,因变量与自变量正相关 即:因变量随着自变量的增大图像趋势上增大 II.当所有点分布在从左上到右下的区域时,因变
16、量与自变量负相关 即:因变量随着自变量的增大图像趋势上减小例:对变量x, y 有观测数据理力争(,)(i=1,2,,10),得散点图1;对变量u ,v 有观测数据(,)(i=1,2,,10),得散点图2. 由这两个散点图可以判断( )(A)变量x 与y 正相关,u 与v 正相关 (B)变量x 与y 正相关,u 与v 负相关(C)变量x 与y 负相关,u 与v 正相关 (D)变量x 与y 负相关,u 与v 负相关例2:变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8
17、,3),(12.5,2),(13,1).表示变量Y与X之间的线性相关系数,表示变量V与U之间的线性相关系数,则 ( ) A. B. C. D. 2)相关系数 相关系数从代数角度衡量因变量与自变量的相关关系,做如下说明: a.相关系数 b.,完全正相关,即:因变量随着自变量的增大一定增大 ,正相关,即:因变量随着自变量的增大趋势上增大 越大,正相关性越强 c. ,完全负相关,即:因变量随着自变量的增大一定减小 ,负相关,即:因变量随着自变量的增大趋势上减小 越小,负相关性越强 d. ,自变量与因变量无线性相关性 注意:“越大,相关性越强”这种说法是错误的。为什么呢?例:已知收集到的数据在散点图中
18、所有的点都在直线上,则两个变量的相关系数 线性回归直线 a.线性回归直线较为准确的给出了因变量与自变量的线性代数关系 b.回归直线使得散点图中的点比较均匀地分布在回归直线两侧,但不意味着直线两端的点个数一定相同 c.线性回归直线的参数的估计值的计算采用最小二乘法,所谓最小二乘法是使得实际值与估计值的差的平方和最小的一种方法,在该种方法下,求得的参数使得回归直线是最佳的一条 d., e.线性回归直线一定经过样本中心点 f.回归直线的斜率与相关系数r符号相同,但是与r数值没有关系,同时表示自变量每变化一个单位,因变量变化个单位 g. 通过回归直线计算出的因变量值是一个预报值,在实际值的上下例:已知
19、变量与正相关,且由观测数据算得样本的平均数,则由观测的数据得线性回归方程可能为( ) 例2:根据如下样本数据x345678y4.02.50.5得到的回归方程为,则( ) A. B. C. D.例3:设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中不正确的是( )A.y与x具有正的线性相关关系B.回归直线过样本点的中心(,)C.若该大学某女生身高增加1cm,则其体重约增加0.85kgD.若该大学某女生身高为170cm,则可断定其体重比为58.79kg 回归
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 概率 讲义
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【天****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【天****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。