初级第四章分层随机抽样.ppt
《初级第四章分层随机抽样.ppt》由会员分享,可在线阅读,更多相关《初级第四章分层随机抽样.ppt(83页珍藏版)》请在咨信网上搜索。
1、 抽样调查抽样调查 原理与方法原理与方法第四章第四章 分层随机抽样分层随机抽样 第一节第一节 基本问题基本问题 一、什么是分层随机抽样一、什么是分层随机抽样 抽样调查抽样调查 原理与方法原理与方法利用辅助信息,在抽样之前将总体的利用辅助信息,在抽样之前将总体的N N个单元划分为互个单元划分为互不交叉、重叠的不交叉、重叠的L L个层,每一层包含的单元数分别为个层,每一层包含的单元数分别为 ,从而,从而 。随后,抽样在每。随后,抽样在每个层中独立地进行,分别从各个层中抽取大小为个层中独立地进行,分别从各个层中抽取大小为 ,的样本,得到的大小为的样本,得到的大小为 ()()的样本称为分层样本。的样本
2、称为分层样本。由上述定义,在每个层内采用的抽样方法可以相同,也由上述定义,在每个层内采用的抽样方法可以相同,也可以不同。若每层中的抽样都是简单随机抽样,那可以不同。若每层中的抽样都是简单随机抽样,那么这种分层抽样就称作分层随机抽样,所得到的样么这种分层抽样就称作分层随机抽样,所得到的样本称为分层随机样本。本称为分层随机样本。抽样调查抽样调查 原理与方法原理与方法第四章第四章 分层随机抽样分层随机抽样 二、特点二、特点 1.1.提高估计精度提高估计精度分分层层抽抽样样如如果果实实施施的的好好,将将可可以以提提高高整整体体估估计计的的精精度度,即即抽抽样样效效率率较较高高。这这是是因因为为分分层层
3、抽抽样样估估计计量量的的方方差差只只和和层层内内方方差差有有关关,和和层层间间方方差差无无关关。因因此此,人人们们可可以以通通过过对对总总体体分分层层,尽尽可可能能地地降降低低层层内内差差异异,使使层层间间差差异异尽尽可可能能大大,从从而而提提高高估估计计的的精精度度。比比如如,不不同同年年龄龄的的人人血血压压值值通通常常存存在在很很大大差差异异,因因此此在在研研究究血血压压的的时时候候,按按照照不不同同的的年年龄龄分分类类是是很很有有意意义义的的。在在研研究究地地区区农农作作物物产产量量的的时时候候,按按照照地地形形的的不不同同分分类类也也是是很很有有意意义义的的,沼沼泽泽地里的农作物和森林
4、里的农作物就有很大差异。地里的农作物和森林里的农作物就有很大差异。抽样调查抽样调查 原理与方法原理与方法2.2.可对各层进行估计可对各层进行估计分分层层抽抽样样不不仅仅能能对对总总体体指指标标进进行行推推算算,而而且且能能够够对对各各层层指指标标进进行行推推算算。有有时时候候,调调查查的的目目的的不不仅仅要要推推算算总总体体指指标标,而而且且需需要要推推算算各各层层的的指指标标。例例如如,某某省省准准备备实实施施一一项项针针对对全全省省中中小小企企业业的的调调查查,以以了了解解它它们们的的生生存存状状况况,要要求求最最终终能能给给出出各各企企业业所所属属行行业业的的相相关关指指标标。从从而而,
5、如如果果按按行行业业进进行行分分层层,调调查查所所得得的的样样本本则则不不仅仅能能推推算全省的指标,还能对各个行业的相关指标进行推算。算全省的指标,还能对各个行业的相关指标进行推算。抽样调查抽样调查 原理与方法原理与方法3 3.便于组织便于组织分层抽样实施起来灵活方便,也便于组织。一方面,由于抽样在各层分层抽样实施起来灵活方便,也便于组织。一方面,由于抽样在各层独立进行,因而允许我们视层内的具体情况采用不同的抽样方法。独立进行,因而允许我们视层内的具体情况采用不同的抽样方法。例如,在一个商业调查中,规模较大的公司可能采取邮寄的方式例如,在一个商业调查中,规模较大的公司可能采取邮寄的方式调查,而
6、小的公司可能采用入户调查或者电话调查的方式。再比调查,而小的公司可能采用入户调查或者电话调查的方式。再比如,对于某些调查,针对城市和农村可能要采用不同的调查方法。如,对于某些调查,针对城市和农村可能要采用不同的调查方法。另一方面,分层抽样的数据处理比较简单,各层的数据处理可以另一方面,分层抽样的数据处理比较简单,各层的数据处理可以单独进行,而层间汇总方式又非常简单,对估计量而言仅是对均单独进行,而层间汇总方式又非常简单,对估计量而言仅是对均值估计的加权平均或是对总量估计的简单相加,相应的精度估计值估计的加权平均或是对总量估计的简单相加,相应的精度估计也不复杂。也不复杂。抽样调查抽样调查 原理与
7、方法原理与方法4.4.避免样本结构与总体结构避免样本结构与总体结构严重严重失真失真与简单随机样本相比,分层样本由于分别抽自各层,因而在总体中的与简单随机样本相比,分层样本由于分别抽自各层,因而在总体中的分布更为均匀,能较大程度地避免样本结构与总体结构严重失真分布更为均匀,能较大程度地避免样本结构与总体结构严重失真的情形发生。假如要进行全国使用语言文字的调查,估计讲普通的情形发生。假如要进行全国使用语言文字的调查,估计讲普通话、少数民族语言以及地方方言的人数等情况,如果采用简单随话、少数民族语言以及地方方言的人数等情况,如果采用简单随机抽样,则很难抽到一个代表使用各种语言文字的样本。由于抽机抽样
8、,则很难抽到一个代表使用各种语言文字的样本。由于抽样的随机性,一些少数民族可能不会出现在样本中。此时如果采样的随机性,一些少数民族可能不会出现在样本中。此时如果采用按民族划分的分层抽样,就能够较大程度地避免样本结构失真用按民族划分的分层抽样,就能够较大程度地避免样本结构失真的问题,获得对总体而言更有代表性的样本。的问题,获得对总体而言更有代表性的样本。抽样调查抽样调查 原理与方法原理与方法三、分层原则三、分层原则根据分层抽样的特点,分层除了可以提供层指标和便于调查的组织实施,通常,根据分层抽样的特点,分层除了可以提供层指标和便于调查的组织实施,通常,使用分层抽样的主要目的是为了提高估计的精度。
9、使用分层抽样的主要目的是为了提高估计的精度。总体中的每一个单元一定属于并且只属于某一个层,而不可能同时属于两个层总体中的每一个单元一定属于并且只属于某一个层,而不可能同时属于两个层或不属于任何一个层。或不属于任何一个层。分层抽样通常分层抽样通常考虑考虑如下如下原则原则:1 1可以对调查对象按不同类型进行划分,划分后层内单元具有相同性可以对调查对象按不同类型进行划分,划分后层内单元具有相同性质。这时,分层抽样能够对每一类的目标量进行估计。质。这时,分层抽样能够对每一类的目标量进行估计。2 2为了方便抽样的组织和实施,通常按行政管理机构设置进行分层。为了方便抽样的组织和实施,通常按行政管理机构设置
10、进行分层。抽样调查抽样调查 原理与方法原理与方法3 3目标总体应具有这样的结构:即对总体分层后能使得层内单目标总体应具有这样的结构:即对总体分层后能使得层内单元的标志值尽量相近,而层间单元的差异尽可能大。这时,元的标志值尽量相近,而层间单元的差异尽可能大。这时,分层抽样能够达到提高抽样估计精度的目的。分层抽样能够达到提高抽样估计精度的目的。4 4既按类型又按层内单元标志值相近的原则进行多重分层,可既按类型又按层内单元标志值相近的原则进行多重分层,可同时达到实现估计类值和提高估计精度的目的。同时达到实现估计类值和提高估计精度的目的。抽样调查抽样调查 原理与方法原理与方法四、四、实施方法实施方法首
11、先,根据分层的目的确定分层的标志,也就是首先,根据分层的目的确定分层的标志,也就是首先,根据分层的目的确定分层的标志,也就是首先,根据分层的目的确定分层的标志,也就是应根据研究的需要来分层。应根据研究的需要来分层。应根据研究的需要来分层。应根据研究的需要来分层。分层的目的不同,分层的分层的目的不同,分层的标志通常也不一样:为了便于抽样的组织管理,可以按总体单元标志通常也不一样:为了便于抽样的组织管理,可以按总体单元的组织系统来分层;为了了解各地区子总体的情况,可以按地区的组织系统来分层;为了了解各地区子总体的情况,可以按地区来分层;为了提高抽样效率,可以把标志值大小相近的单元划在来分层;为了提
12、高抽样效率,可以把标志值大小相近的单元划在同一层内,按标志值大小分层。上述分层目的如果能够统一起来同一层内,按标志值大小分层。上述分层目的如果能够统一起来则最佳,如果不能统一则需要权衡利弊,服从主要目的。另外,则最佳,如果不能统一则需要权衡利弊,服从主要目的。另外,当分层的目的是为了提高抽样效率时,由于现实中的调查通常是当分层的目的是为了提高抽样效率时,由于现实中的调查通常是多指标的,那么就会有以哪个指标作为分层标志的问题。这时需多指标的,那么就会有以哪个指标作为分层标志的问题。这时需要视具体情况来决定是按照主要指标来分层,还是施行照顾多数要视具体情况来决定是按照主要指标来分层,还是施行照顾多
13、数指标的折衷方案来分层。指标的折衷方案来分层。抽样调查抽样调查 原理与方法原理与方法其次,实施分层抽样,要求事先掌握总体单元的有关信其次,实施分层抽样,要求事先掌握总体单元的有关信其次,实施分层抽样,要求事先掌握总体单元的有关信其次,实施分层抽样,要求事先掌握总体单元的有关信息,如分层的抽样框,分层后各层的总体单元数等。息,如分层的抽样框,分层后各层的总体单元数等。息,如分层的抽样框,分层后各层的总体单元数等。息,如分层的抽样框,分层后各层的总体单元数等。但在某些场合,我们可能没有层的抽样框。这时可以采用先抽样,再根但在某些场合,我们可能没有层的抽样框。这时可以采用先抽样,再根据样本单元进行分
14、层的办法。这种分层称作事后分层,将在本章的据样本单元进行分层的办法。这种分层称作事后分层,将在本章的后面后面加以介绍。加以介绍。最后,要确定层的划分界限,即划分多少层的问题。最后,要确定层的划分界限,即划分多少层的问题。最后,要确定层的划分界限,即划分多少层的问题。最后,要确定层的划分界限,即划分多少层的问题。如果如果用于分层的指标是属性变量,如性别、行政区划等,通常可按其分类值用于分层的指标是属性变量,如性别、行政区划等,通常可按其分类值直接进行划分。但有时候也需要根据研究目的来确定层的粗细,比如全直接进行划分。但有时候也需要根据研究目的来确定层的粗细,比如全国按地区分层,既可以按行政区划的
15、省、市分层,也可以按经济发展情国按地区分层,既可以按行政区划的省、市分层,也可以按经济发展情况将几个省市归并在一起作为一个层。而如果用于分层的指标是数值型况将几个省市归并在一起作为一个层。而如果用于分层的指标是数值型变量,例如工业企业可按产值或增加值分层,人口可按年龄分层等,这变量,例如工业企业可按产值或增加值分层,人口可按年龄分层等,这时划分多少个层,就具有很大的灵活性。此时需要综合考虑研究目的、时划分多少个层,就具有很大的灵活性。此时需要综合考虑研究目的、抽样框的可获得性、如何提高抽样效率等多方面的因素,做到恰当的分抽样框的可获得性、如何提高抽样效率等多方面的因素,做到恰当的分层。层。抽样
16、调查抽样调查 原理与方法原理与方法第四章第四章 分层随机抽样分层随机抽样 五、符号五、符号 总体总体 样本样本第第 层单位数层单位数 单位数总和单位数总和 第第 层均值层均值 第第 层方差层方差 抽样调查抽样调查 原理与方法原理与方法第四章第四章 分层随机抽样分层随机抽样 第第 层权数层权数 第第 层抽样比层抽样比等比例抽样等比例抽样 即:即:不等比抽样不等比抽样 抽样调查抽样调查 原理与方法原理与方法第二节 估 计 量一、对总体均值的估计一、对总体均值的估计分层样本分层样本,总体均值总体均值 的估计的估计分层随机样本分层随机样本,总体均值总体均值 的简单估计的简单估计 抽样调查抽样调查 原理
17、与方法原理与方法估计量的性质 性性质质1 1:对对于于一一般般的的分分层层抽抽样样,如如果果 是是 的的无无偏偏估估计计(),则则 是是 的的无无偏偏估估计计。的的方方差差为:为:只要对各层估计无偏,则总体估计也无偏。只要对各层估计无偏,则总体估计也无偏。n各各层层可可以以采采用用不不同同的的抽抽样样方方法法,只只要要相相应应的的估估计计量量是无偏的,则对总体的推算也是无偏的。是无偏的,则对总体的推算也是无偏的。抽样调查抽样调查 原理与方法原理与方法证明性质1 由于对每一层有由于对每一层有 因此,因此,估计量的方差估计量的方差 由由于于各各层层是是独独立立抽抽取取的的,因因此此上上式式第第二二
18、项项中中的的协协方方差差全全为为0 0,从而有,从而有 抽样调查抽样调查 原理与方法原理与方法 性质性质2 2:对于分层随机抽样,:对于分层随机抽样,是是 的无偏估计,的无偏估计,的方差为:的方差为:抽样调查抽样调查 原理与方法原理与方法证明性质2:对对于于分分层层随随机机抽抽样样,各各层层独独立立进进行行简简单单随随机机抽抽样样,对每一层有对每一层有 因此,由性质因此,由性质1 1,有,有 由第二章性质由第二章性质2 2,得,得 因此因此 抽样调查抽样调查 原理与方法原理与方法 性性质质3 3:对对于于分分层层随随机机抽抽样样,的的一一个个无无偏偏估计为:估计为:抽样调查抽样调查 原理与方法
19、原理与方法证明性质3:对对于于分分层层随随机机抽抽样样,各各层层独独立立进进行行简简单单随随机机抽抽样样,由由第第二二章章性性质质3 3,得得 的的无无偏偏估估计为:计为:因此,因此,的一个无偏估计为:的一个无偏估计为:抽样调查抽样调查 原理与方法原理与方法二、对总体总量的估计 总体总量总体总量 的估计为:的估计为:如果得到的是分层随机样本,则总体总量的如果得到的是分层随机样本,则总体总量的简单估计为:简单估计为:抽样调查抽样调查 原理与方法原理与方法2.2.估计量的性质估计量的性质性质性质4 4:对于一般的分层抽样,如果:对于一般的分层抽样,如果是是 的的无无偏偏估估计计,则则 是是 的的无
20、无偏偏估估计计。的的方差为:方差为:抽样调查抽样调查 原理与方法原理与方法性质性质5 5:对于分层随机抽样,:对于分层随机抽样,的方差为:的方差为:抽样调查抽样调查 原理与方法原理与方法性质性质6 6:对于分层随机抽样,:对于分层随机抽样,的一个无偏的一个无偏估计为:估计为:抽样调查抽样调查 原理与方法原理与方法例3.1 调调查查某某地地区区的的居居民民奶奶制制品品年年消消费费支支出出,以以居居民民户户为为抽抽样样单单元元,根根据据经经济济及及收收入入水水平平将将居居民民户户划划分分为为4 4层层,每每层层按按简简单单随随机机抽抽样样抽抽取取1010户户,调调查查获获得得如如下下数数据据(单单
21、位位:元元),要要估估计计该该地地区区居居民民奶奶制制品品年年消消费费总总支支出出及及估估计计的标准差。的标准差。层层居民户居民户总数总数样本户奶制品年消费支出样本户奶制品年消费支出1234567891012001040011015104080900240050130608010055160851601703750180260110014060200180300220415005035150203025103025 抽样调查抽样调查 原理与方法原理与方法 抽样调查抽样调查 原理与方法原理与方法 抽样调查抽样调查 原理与方法原理与方法第四章第四章 分层随机抽样分层随机抽样 例:例:类别类别(户)
22、(户)总村数总村数 0-150-15 635 635 153 153 4.05 4.05 20.19 20.19 16-30 570 16-30 570 138 13810.31 69.9610.31 69.96 31-50 475 31-50 475 115 11515.2915.29 63.13 63.13 51-75 51-75 303 303 73 7323.1623.16 170.32 170.32 76-100 89 76-100 89 21 2128.7128.71 184.90 184.90 合计合计 20722072 500 500 以以95.45%95.45%概率估计耕牛总
23、头数的置信区间概率估计耕牛总头数的置信区间 抽样调查抽样调查 原理与方法原理与方法第四章第四章 分层随机抽样分层随机抽样 抽样调查抽样调查 原理与方法原理与方法 三、对总体比例的估计 总体比例总体比例P P的估计为:的估计为:估计量的性质估计量的性质 性性质质7 7:对于一般的分层抽样,如果 是 的无偏估计(),则 是 的无偏估计。的方差为:抽样调查抽样调查 原理与方法原理与方法性质性质8 8:对于分层随机抽样,:对于分层随机抽样,是是 的无偏估计,的无偏估计,因而 的方差为:抽样调查抽样调查 原理与方法原理与方法 性质性质9 9:对于分层随机抽样,的一个无偏估计为:抽样调查抽样调查 原理与方
24、法原理与方法例3.2 在在例例3.13.1的的调调查查中中,同同时时调调查查了了居居民民户户拥拥有有家家庭庭电电脑脑的的情情况况,获获得得如如下下数数据据(单单位位:台台),要要估估计计该该地地区区居居民民拥拥有有家家庭庭电电脑脑的的比比例例及及估估计计的的标标准差。准差。层层居民居民户总户总数数样本户拥有家庭电脑情况样本户拥有家庭电脑情况12345678910120000010001002400010000001037501100001010415001000000000 抽样调查抽样调查 原理与方法原理与方法解:由上表可得,由上表可得,根据前面对各层层权根据前面对各层层权 及抽样比及抽样比
25、 的计算结果,可得各层估计量的方差:的计算结果,可得各层估计量的方差:因此,该地区居民拥有家庭电脑比例的估计为:因此,该地区居民拥有家庭电脑比例的估计为:估计量的方差为:估计量的方差为:估计量的标准差为:估计量的标准差为:抽样调查抽样调查 原理与方法原理与方法第四章第四章 分层随机抽样分层随机抽样 第三节第三节 各层中样本单位数的分配各层中样本单位数的分配 一、一、不同分配方式不同分配方式 层层 常常数数分分配配 与与 成成正正比比 与与 成成正正比比 内内曼曼分分配配 1 0.2 20 100 49 60 40 2 0.3 30 100 110 90 90 3 0.5 34 100 141
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 初级 第四 分层 随机 抽样
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【精***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【精***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。