《统计学》-单薇主编-第5章抽样与抽样分布ppt.ppt
《《统计学》-单薇主编-第5章抽样与抽样分布ppt.ppt》由会员分享,可在线阅读,更多相关《《统计学》-单薇主编-第5章抽样与抽样分布ppt.ppt(108页珍藏版)》请在咨信网上搜索。
1、第第5章章 抽样与抽样分布抽样与抽样分布学习目标学习目标理解随机试验和随机事件的概念,了解事件之间的关系;理解概率的定义,掌握概率的运算法则;理解随机变量和概率分布的概念;掌握二项分布的主要特征及其应用;掌握正态分布的主要特征及其应用;了解随机抽样方法;了解抽样分布的形成过程,理解抽样分布的意义,掌握抽样分布的性质;理解大数定律和中心极限定理。目录目录抽样调查概述抽样估计的原理抽样分布SPSS在概率论中的应用5.1 抽样调查概述抽样调查概述抽样调查抽样调查:按照一定的规则从总体中取出一部分单元组成一个样本,并收集样本的数据资料的过程,简称为抽样抽样。样本:样本:按照一定的抽样规则从总体中抽取的
2、一部分单位组成的集合。根据抽样的原则不同,抽样方法有随机抽随机抽样样和非随机抽样非随机抽样两种。随机抽样:随机抽样:随机抽样:随机抽样:根据一个已知的概率来抽取样本根据一个已知的概率来抽取样本单位,也称单位,也称随机抽样随机抽样随机抽样随机抽样 非随机抽样:非随机抽样:非随机抽样:非随机抽样:研究人员有意识地选取样本单研究人员有意识地选取样本单位,样本单位的选取不是随机的。位,样本单位的选取不是随机的。随机抽样的特点特点:1.1.按一定的概率以随机原则抽取样本;按一定的概率以随机原则抽取样本;抽取样本时,使每个单位都有一定的机会被抽中。抽取样本时,使每个单位都有一定的机会被抽中。2.2.每每个
3、个单单位位被被抽抽中中的的概概率率是是已已知知的的,或或是是可可以以计算出来的计算出来的;3.3.当当用用样样本本对对总总体体目目标标量量进进行行估估计计时时,要要考考虑虑到每个样本单位被抽中的概率。到每个样本单位被抽中的概率。5.1.1 简单随机抽样简单随机抽样简单随机抽样:简单随机抽样:从总体N个单位中抽取n个单位作为样本时,使得每一个总体单位都有相同的机会(概率)被抽中 也称也称纯随机抽样纯随机抽样纯随机抽样纯随机抽样 是抽样调查中是抽样调查中应用最多应用最多应用最多应用最多的方法之一的方法之一 也是也是最基本最基本最基本最基本的抽样方法之一的抽样方法之一简单随机抽样抽取元素的具体方法有
4、:重复抽样重复抽样重复抽样重复抽样:从总体中抽取一个单位并加以计:从总体中抽取一个单位并加以计量后,把这个单位放回到总体中再抽取第二个量后,把这个单位放回到总体中再抽取第二个单位,直到抽取单位,直到抽取n n个单位为止;个单位为止;不重复抽样不重复抽样不重复抽样不重复抽样:一个单位被抽中后不再放回总:一个单位被抽中后不再放回总体,然后再从所剩下的单位中抽取第二个单位,体,然后再从所剩下的单位中抽取第二个单位,直到抽出直到抽出n n个单位为止。个单位为止。特点:特点:简简单单、直直观观,在在抽抽样样框框完完整整时时,可可直直接接从从中中抽取样本;抽取样本;用样本统计量对目标量进行估计比较方便。用
5、样本统计量对目标量进行估计比较方便。局限性:局限性:当当N N很大时,不易构造抽样框;很大时,不易构造抽样框;抽出的单位很分散,给实施调查增加了困难;抽出的单位很分散,给实施调查增加了困难;没有利用其他辅助信息以提高估计的效率。没有利用其他辅助信息以提高估计的效率。5.1.2 分层抽样分层抽样分层抽样:分层抽样:在抽样之前先将总体的单位按某种特征或某种规则划分为若干层(类),然后从不同的层中独立、随机地抽取一定数量的单位组成一个样本,也称分类抽样分类抽样(stratified sampling)。)。在分层或分类时,应使层内各单位的差异尽可能小,而使层与层之间的差异尽可能大。分层抽样的优点:优
6、点:既既可可以以对对总总体体进进行行估估计计,也也可可以以对对各各层层的的子子总体进行估计;总体进行估计;抽样的组织和实施都比较方便;抽样的组织和实施都比较方便;分分层层抽抽样样的的样样本本分分布布在在各各个个层层内内,从从而而使使样样本在总体中的分布比较均匀;本在总体中的分布比较均匀;估计的精度高。估计的精度高。5.1.3 系统抽样系统抽样 系统抽样:系统抽样:系统抽样:系统抽样:在抽样中先将总体各单位按某种顺序在抽样中先将总体各单位按某种顺序排列,并按某种规则在一定的范围内随机确定一排列,并按某种规则在一定的范围内随机确定一个起点,然后每隔一定的间隔抽取一个单位,直个起点,然后每隔一定的间
7、隔抽取一个单位,直到抽取到抽取n n个单位为止,也称个单位为止,也称等距抽样等距抽样等距抽样等距抽样或或机械抽样。机械抽样。机械抽样。机械抽样。从数字从数字1 1到到k k之间随机抽取一个数字之间随机抽取一个数字r r作为初始单位,作为初始单位,然后依次取然后依次取r r+k k,r r+2+2k k,r r+(+(n n-1)-1)k k 优点:优点:优点:优点:简便易行;简便易行;系统抽样的样本在总体中的分布一般比较均匀,由此系统抽样的样本在总体中的分布一般比较均匀,由此抽样误差通常要小于简单随机抽样。抽样误差通常要小于简单随机抽样。缺点:缺点:缺点:缺点:对估计量方差的估计比较困难。对估
8、计量方差的估计比较困难。5.1.4 整群抽样整群抽样整群抽样:整群抽样:调查时先将总体划分成若干群,然后再以群作为调查单位从中抽取部分群,进而对抽中的各个群中所包含的所有个体单位进行调查和观察。特点:特点:抽样时只需群的抽样框,可简化工作量;抽样时只需群的抽样框,可简化工作量;调调查查的的地地点点相相对对集集中中,节节省省调调查查费费用用,方方便便调查的实施。调查的实施。缺点:缺点:估计的精度较差。5.2 抽样估计的原理抽样估计的原理抽样估计抽样估计:在抽样调查的基础上,利用样本的数据资料计算样本指标,以样本特征值对总体特征值做出具有一定可靠程度的估计和判断。是由部分推断总体的一种认识方法,建
9、立在是由部分推断总体的一种认识方法,建立在随机取样的基础上,主要运用不确定的概率估随机取样的基础上,主要运用不确定的概率估计方法(分布理论、大数定律、中心极限定理计方法(分布理论、大数定律、中心极限定理和抽样分布理论),其误差可以事先计算并加和抽样分布理论),其误差可以事先计算并加以控制。以控制。其目的是用样本统计量来推断总体参数。其目的是用样本统计量来推断总体参数。在简单随机重复抽样中,每次抽样都是独立的。如果从总体N个单元中抽取容量为n的样本,随机变量Xi表示第i次抽样的结果,则Xi服从在总体N个单元上均匀取值的多项分布,所以 为独立同分布随机变量序列X1,X2,Xn和的一个取值,其中 如
10、果总体中具有性质的A单元的比率为,随机变量Yi=1表示第i次抽样取得的样本单元具有性质A,否则Yi=0,则Yi服从概率为的两点分布,所以np为独立同分布随机变量序列Y1,Y2,Yn和的一个取值,其中关于独立同分布随机变量和的概率分布,大数定律和中心极限定理给出了很好的解释。5.2.1 抽样估计的基本理论抽样估计的基本理论v概率与概率分布 必然现象(确定性现象)必然现象(确定性现象)变化结果是事先可以确定的,一定的条件必然导致某一变化结果是事先可以确定的,一定的条件必然导致某一结果;结果;这种关系通常可以用公式或定律来表示。这种关系通常可以用公式或定律来表示。随机现象(不确定现象)随机现象(不确
11、定现象)在一定条件下可能发生也可能不发生的现象;在一定条件下可能发生也可能不发生的现象;个别观察的结果完全是偶然的、随机会而定;个别观察的结果完全是偶然的、随机会而定;大量观察的结果会呈现出某种规律性大量观察的结果会呈现出某种规律性 (随机性中寓含着规律性)(随机性中寓含着规律性)统计规律性。统计规律性。十五的夜晚能看见月亮?十五的月亮比初十圆!1.随机试验随机试验严格意义上的随机试验满足三个条件满足三个条件:试验可以在系统条件下重复进行;试验可以在系统条件下重复进行;试验的所有可能结果是明确可知的;试验的所有可能结果是明确可知的;每次试验前不能肯定哪一个结果会出现。每次试验前不能肯定哪一个结
12、果会出现。广义的随机试验是指对随机现象的观察是指对随机现象的观察(或实验)(或实验)实际应用中多数试验不能同时满足上述条件,实际应用中多数试验不能同时满足上述条件,常常从广义角度来理解。常常从广义角度来理解。2.随机事件随机事件随机事件(简称简称事件):随机试验的某一个可能结果,常用大写英文字母A、B、来表示。基本事件(样本点):不可能再分成为两个基本事件(样本点):不可能再分成为两个或更多事件的事件。或更多事件的事件。复合事件:由简单事件组合而成的事件。复合事件:由简单事件组合而成的事件。样本空间():基本事件的全体(全集)。两个特例两个特例必然事件必然事件:在一定条件下,每次试验都必然发生
13、的事件。只有样本空间只有样本空间 才是必然事件才是必然事件不可能事件不可能事件:在一定条件下,每次试验都必然不会发生的事件。不可能事件是一个空集(不可能事件是一个空集()3.随机事件的概率随机事件的概率概率:用来度量随机事件发生可能性大小的数值。必然事件的概率为必然事件的概率为1 1,表示为,表示为P P()=1)=1 不可能事件发生的可能性是零,不可能事件发生的可能性是零,P P()=0)=0 随机事件随机事件A A的概率介于的概率介于0 0和和1 1之间,之间,0 0 P P(A A)1 1概率的三种定义,给出了确定随机事件概率的三条途经。概率的古典定义概率的古典定义前提:古典概型定义(公
14、式)【例】设有50件产品,其中有5件次品,现从这50件中任取2件,求抽到的两件产品均为合格品的概率是多少?抽到的两件产品均为次品的概率又是多少?概率的统计定义概率的统计定义若在相同的条件下重复进行的n次试验中,事件A发生了m次,当试验次数 n 很大时,事件A发生频率m/n 稳定地在某一常数 p 上下波动,而且这种波动的幅度一般会随着试验次数增加而缩小,则定义 p 为事件A发生的概率 当当n n相当大时,可用事件发生的频率相当大时,可用事件发生的频率m/nm/n作为其概作为其概率的一个近似值率的一个近似值计算概率的统计方法(频率计算概率的统计方法(频率方法)方法)【例例】根据古典概率定义可算出,
15、抛一枚质地均匀的硬币,出现正面与出现反面的概率都是0.5。历史上有很多人都曾经做过抛硬币试验。试验者试验者试验次数试验次数正面出现的频率正面出现的频率蒲丰蒲丰404040400.50690.5069K.K.皮尔逊皮尔逊12000120000.50160.5016K.K.皮尔逊皮尔逊24000240000.50050.5005罗曼诺夫斯基罗曼诺夫斯基80640806400.49790.4979【例例】某地区几年来新生儿性别的统计资料如下表所示,由此可判断该地区新生儿为男婴的概率是多少?观察年份观察年份新生儿数(个)新生儿数(个)男婴数(个)男婴数(个)男婴比例()男婴比例()2000200016
16、2416248278270.5090.50920012001120512056226220.5160.51620022002151215127747740.5120.51220032003140714077157150.5080.508主观概率主观概率有些随机事件发生的可能性,既不能通过等可能事件个数来计算,也不能根据大量重复试验的频率来近似。主观概率依据人们的主观判断而估计的随机事件发生的可能性大小。例如某经理认为新产品畅销的可能性是例如某经理认为新产品畅销的可能性是8080人们的经验、专业知识、对事件发生的众多条件或影响因素的分析等等,都是确定主观概率的依据。4.概率的性质概率的性质非负性
17、:对任意事件A,有 P(A)0规范性:必然事件的概率为1,即:P()=1可加性:若A与B互斥,则 P(A B)=P(A)+P(B)上述三条基本性质,也称为概率的三条公理。概率的公理化定义概率的公理化定义 概率的以上三种定义,各有其特定的应用范围,概率的以上三种定义,各有其特定的应用范围,也存在局限性,都缺乏严密性也存在局限性,都缺乏严密性 古典定义要求试验的基本事件有限且具有等可能性古典定义要求试验的基本事件有限且具有等可能性 统计定义要求试验次数充分大,但试验次数究竟应该统计定义要求试验次数充分大,但试验次数究竟应该取多大、频率与概率有多么接近都没有确切说明取多大、频率与概率有多么接近都没有
18、确切说明 主观概率的确定又具有主观随意性主观概率的确定又具有主观随意性 苏联数学家柯尔莫哥洛夫于苏联数学家柯尔莫哥洛夫于19331933年提出了概率的年提出了概率的公理化定义公理化定义 通过规定应具备的基本性质来定义概率通过规定应具备的基本性质来定义概率 公理化定义为概率论严谨的逻辑推理打下了坚实公理化定义为概率论严谨的逻辑推理打下了坚实的基础的基础5.条件概率条件概率条件概率:在某些附加条件下计算的概率在已知事件B已经发生的条件下A发生的条件概率P(A|B)条件概率的一般公式:其中其中 P P(B)B)0 0。乘法公式:P(AB)P(A)P(B|A)或 P(AB)P(B)P(A|B)P(A|
19、B)在B发生的所有可能结果中AB发生的概率。即在样本空间中考虑的条件概率P(A|B),就变成在新的样本空间B中计算事件AB的概率问题了。一旦事件一旦事件B已发生已发生ABABBAB【例例】某公司甲乙两厂生产同种产品。甲厂生产某公司甲乙两厂生产同种产品。甲厂生产400400件,其中一级品为件,其中一级品为280280件;乙厂生产件;乙厂生产600600件,件,其中一级品有其中一级品有360360件。若要从该厂的全部产品中件。若要从该厂的全部产品中任意抽取一件,试求:任意抽取一件,试求:已知抽出产品为一级品已知抽出产品为一级品的条件下该产品出自甲厂的概率;的条件下该产品出自甲厂的概率;已知抽出产已
20、知抽出产品出自甲厂的条件下该产品为一级品的概率。品出自甲厂的条件下该产品为一级品的概率。解:设解:设A A“甲厂产品甲厂产品”,B B“一级品一级品”,则:,则:P P(A A)0.40.4,P(B)P(B)0.640.64,P(AB)P(AB)0.280.28 所求概率为事件所求概率为事件B B发生条件下发生条件下A A发生的条件概率发生的条件概率 P P(A|BA|B)0.28/0.640.28/0.64所求概率为事件所求概率为事件A A发生条件下发生条件下B B发生的条件概率发生的条件概率 P P(B B|A A)0.28/0.40.28/0.4【例】对例3-1中的问题(从这50件中任取
21、2件产品,可以看成是分两次抽取,每次只抽取一件,不放回抽样)解:A1 1第一次抽到合格品 A2 2第二次抽到合格品 A1 1A2 2抽到两件产品均为合格品6.事件的独立性事件的独立性两个事件独立 一个事件的发生与否并不影响另一个事件发一个事件的发生与否并不影响另一个事件发生的概率生的概率 P P(A A|B B)P P(A A),或,或 P P(B B|A A)P P(B B)独立事件的乘法公式:P P(ABAB)P P(A A)P P(B B)推广到n个独立事件,有:P P(A A1 1A An n)P P(A A1 1)P P(A A2 2)P P(A An n)7.随机变量随机变量随机变
22、量表示随机试验结果的变量 取值是随机的,事先不能确定取哪一个值取值是随机的,事先不能确定取哪一个值 一个取值对应随机试验的一个可能结果一个取值对应随机试验的一个可能结果 用大写字母如用大写字母如X X、Y Y、Z Z.来表示,具体取值则来表示,具体取值则用相应的小写字母如用相应的小写字母如x x、y y、zz来表示来表示 根据取值特点的不同,可分为:离散型随机变量离散型随机变量取值可以一一列举取值可以一一列举 连续型随机变量连续型随机变量取值不能一一列举取值不能一一列举8.离散型随机变量的概率分布离散型随机变量的概率分布X的概率分布X的有限个可能取值为xi与其概率 pi(i=1,2,3,n)之
23、间的对应关系概率分布具有如下两个基本性质:p pi i00,i i=1,2,=1,2,n n;离散型概率分布的表示离散型概率分布的表示概率函数:概率函数:P P(X=xX=xi i)=p=pi i分布列:分布列:分布图:分布图:X X=x xi ix x1 1x x2 2x xn nP P(X X=x xi i)=)=p pi ip p1 1p p2 2p pn n离散型随机变量的数字特征离散型随机变量的数字特征数学期望:方差:性质:伯努利试验伯努利试验伯努利试验:每次试验有且仅有两种可能结果。用用“成功成功”代表所关心的结果,相反的结果代表所关心的结果,相反的结果为为“失败失败”。每次试验中
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 主编 抽样 分布 ppt
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【a199****6536】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【a199****6536】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。