zCH系统抽样第节.pptx
《zCH系统抽样第节.pptx》由会员分享,可在线阅读,更多相关《zCH系统抽样第节.pptx(70页珍藏版)》请在咨信网上搜索。
1、2024/4/19 周五统计学专业必修课3学分1CH8 系统抽样系统抽样Sy:Systematic Sampling4-6课时课时2024/4/19 周五统计学专业必修课3学分2sy在抽样方法体系中的地位在抽样方法体系中的地位nSy在实践中被广泛采用在实践中被广泛采用n理由:理由:n1、sy简便易行,甚至比简便易行,甚至比srs更容易操作更容易操作n2、在了解总体特征的前提下,有效地应用、在了解总体特征的前提下,有效地应用sy可以可以得到很高的精度得到很高的精度nSy可看作一种特殊的可看作一种特殊的cl,又可以看出是一种特殊的,又可以看出是一种特殊的stn学习和应用学习和应用sy时有一些特殊问
2、题需要注意:时有一些特殊问题需要注意:n1、对总体特征的了解非常重要,否则会影响、对总体特征的了解非常重要,否则会影响sy样样本的代表性本的代表性n2、sy方差估计较为复杂,一般很难得到抽样设计方差估计较为复杂,一般很难得到抽样设计意义下的理论方差的无偏估计意义下的理论方差的无偏估计2024/4/19 周五统计学专业必修课3学分3什么是系统抽样什么是系统抽样n等距抽样是典型的等距抽样是典型的SynSy:将总体的:将总体的N个单元个单元按某种顺序排列按某种顺序排列,首先从总体,首先从总体中中srs地抽取第一个样本点地抽取第一个样本点(即即随机起点随机起点),然后按,然后按某种某种确定的规则确定的
3、规则选取其他样本单元选取其他样本单元nSy的两个突出特点:的两个突出特点:n1、抽样之前要先将、抽样之前要先将N个总体单元排序个总体单元排序n2、第一个单元的抽取是随机的,其余、第一个单元的抽取是随机的,其余(n-1)个单元个单元的选取是按照某种确定的规则来取,不具有随机性的选取是按照某种确定的规则来取,不具有随机性n所以,随机起点一经确定,整个样本就确定了,这种所以,随机起点一经确定,整个样本就确定了,这种“牵一发而动全身牵一发而动全身”的整体性正是通常所谓的整体性正是通常所谓“系统系统”的特点,所以称为系统抽样的特点,所以称为系统抽样2024/4/19 周五统计学专业必修课3学分4Sy的优
4、点的优点1、简便易行、简便易行nsy至少能达到至少能达到srs的效果,但比的效果,但比srs容易实施容易实施n主要表现在:主要表现在:l抽样框简单,甚至可以不需要抽样框抽样框简单,甚至可以不需要抽样框l非专业人士很容易操作非专业人士很容易操作2、样本单元在总体中的分布比较均匀,因而一般具有较好、样本单元在总体中的分布比较均匀,因而一般具有较好的代表性的代表性n特别是当总体有适合的辅助变量的信息可以利用时,可以特别是当总体有适合的辅助变量的信息可以利用时,可以采用有序系统抽样,有利于提高估计精度采用有序系统抽样,有利于提高估计精度2024/4/19 周五统计学专业必修课3学分5Sy的一些最直观的
5、案例的一些最直观的案例n街道两旁树木病虫害的研究,从某棵树开始街道两旁树木病虫害的研究,从某棵树开始(起点起点),每隔每隔20棵树抽一棵进行检测棵树抽一棵进行检测n生产企业为了检查产品的质量,每隔生产企业为了检查产品的质量,每隔2小时抽选若干产小时抽选若干产品进行质量检查品进行质量检查n有一叠发票,想要估计它的总金额以及某一类商品的有一叠发票,想要估计它的总金额以及某一类商品的发票在总发票中占的比例,如果发票多,全面计量比发票在总发票中占的比例,如果发票多,全面计量比较麻烦,可以采取每隔较麻烦,可以采取每隔10张抽张抽1张进行观察的方法张进行观察的方法n农业上为估计农作物产量或病虫害危害情况,
6、对一大农业上为估计农作物产量或病虫害危害情况,对一大片农田每隔一定距离片农田每隔一定距离(例如纵横各例如纵横各10米米)抽取一小块抽取一小块(例例如如1/4m2)进行实际测量或调查进行实际测量或调查n图书馆对图书借阅情况进行调查,在一堆按书名字母图书馆对图书借阅情况进行调查,在一堆按书名字母排列的图书目录卡片中,每隔一定厚度排列的图书目录卡片中,每隔一定厚度(例如例如2cm)或或一定张数抽取一张卡片一定张数抽取一张卡片n2024/4/19 周五统计学专业必修课3学分6Sy的缺点的缺点 (应用应用sy应注意的问题应注意的问题)1、sy的效果依赖于调查者对总体特征的了解的效果依赖于调查者对总体特征
7、的了解n如果单元的排列存在周期性变化,而抽样者对此缺如果单元的排列存在周期性变化,而抽样者对此缺乏了解或缺乏处理的经验,抽出的样本的代表性乏了解或缺乏处理的经验,抽出的样本的代表性就可能很差就可能很差2、方差估计比较复杂、方差估计比较复杂n原因:一般原因:一般Sy的方差没有抽样设计意义下的无偏的方差没有抽样设计意义下的无偏估计量,在很多实践中都不是严格的概率抽样估计量,在很多实践中都不是严格的概率抽样伪随机伪随机2024/4/19 周五统计学专业必修课3学分7CH8内容体系内容体系8.1 抽样方式抽样方式理论知识掌握的重点理论知识掌握的重点 n介绍介绍sy的基本思想、的基本思想、sy样本抽选的
8、基本方式、总体单样本抽选的基本方式、总体单元的排序、有序排列元的排序、有序排列(线性排列线性排列)下的下的syn拓展:拓展:sy与与cl和和st的比较的比较8.2 等概率等概率sy估计量及其方差估计量及其方差n估计量的定义及其性质估计量的定义及其性质,介绍估计量方差的几种表现,介绍估计量方差的几种表现形式,各表现形式中具体涉及到的方差不同形式,各表现形式中具体涉及到的方差不同8.3 估计量方差的样本估计估计量方差的样本估计n介绍介绍6种估计量方差的样本估计方法种估计量方差的样本估计方法8.4 进一步讨论的问题进一步讨论的问题n掌握一个基本结论:对于掌握一个基本结论:对于周期性变化的趋势总体周期
9、性变化的趋势总体如何如何确定抽样间隔确定抽样间隔2024/4/19 周五统计学专业必修课3学分8CH8两个特点两个特点1、sy样本的抽选方法非常丰富样本的抽选方法非常丰富n要区分不同特征的总体,进行不同的要区分不同特征的总体,进行不同的sy抽样抽样2、方差估计的内容丰富、方差估计的内容丰富n方差估计的方法比较多方差估计的方法比较多2024/4/19 周五统计学专业必修课3学分98.1 抽样方式抽样方式lSy的样本抽选方式的样本抽选方式l基本方式基本方式l线性线性syl圆圈圆圈syl有序排列下的有序排列下的sy样本抽选方式样本抽选方式l中心中心syl对称对称sylSethi的对称的对称sylSi
10、ghn的对称的对称sy2024/4/19 周五统计学专业必修课3学分10一、一、sy的基本思想的基本思想 (P169)nSy的基本思想体现了实施的基本思想体现了实施sy的三个步骤:的三个步骤:n1、排序、排序n2、随机抽取起始单元,即确定随机起点、随机抽取起始单元,即确定随机起点n3、按某种确定的规则、按某种确定的规则/规律抽取其他样本单元规律抽取其他样本单元n引申出三个问题:引申出三个问题:n1、如何排序?、如何排序?n2、怎样确定起始单元?、怎样确定起始单元?n3、按怎样的规则抽取其他样本单元?、按怎样的规则抽取其他样本单元?n对以上三个问题的不同回答给出不同的对以上三个问题的不同回答给出
11、不同的sy方法方法2024/4/19 周五统计学专业必修课3学分11二、二、sy的基本方式的基本方式(一)线性(一)线性sy(二)圆圈(二)圆圈sy2024/4/19 周五统计学专业必修课3学分12学习学习Sy抽选方式要注意方法间的继起关系抽选方式要注意方法间的继起关系1、这种方法要解决什么问题?、这种方法要解决什么问题?2、基本做法、基本做法l如何排序如何排序l怎样抽取起始单元怎样抽取起始单元l按何种规则抽取其他样本单元按何种规则抽取其他样本单元3、这种方法存在什么问题?、这种方法存在什么问题?4、解决的思路、解决的思路 新的抽选方法新的抽选方法2024/4/19 周五统计学专业必修课3学分
12、13(一)线性(一)线性sy/等距等距sy/直线等距直线等距synN总体单元数,总体单元数,n样本单元数样本单元数1、前提:、前提:N=nk,(k为整数为整数)2、方法、方法n排序、编号排序、编号n 计算抽样间隔计算抽样间隔(sampling interval)k:k=N/n,(k为整数为整数),按,按k将将N个单元划分为个单元划分为n段,每段包含段,每段包含k个单元个单元1N=nkk2k3kn n 随机抽取第一个样本单元:在随机抽取第一个样本单元:在1,k中确定随机数中确定随机数rrr+kr+2kr+(n-1)kn n 等间隔地抽取其他等间隔地抽取其他(n-1)样本单元:样本单元:r+k,r
13、+2k,r+(n-1)k问题:问题:等距等距Sy的随机性体现在哪儿?的随机性体现在哪儿?第一个单元的抽选第一个单元的抽选 这样可能得到的样本有多少个?这样可能得到的样本有多少个?k个,每个样本中含有个,每个样本中含有n个单元个单元 各可能样本被抽中的概率均相同各可能样本被抽中的概率均相同N能被能被n整除时,整除时,等距抽样是严等距抽样是严格意义下的等格意义下的等概率抽样概率抽样2024/4/19 周五统计学专业必修课3学分14线性线性sy(续续)3、存在的问题、存在的问题n如果如果N不能被不能被n整除,即整除,即Nnk,(k为整数为整数)时,时,k一般一般取取N/n的整数部分的整数部分N/n,
14、会造成什么后果呢?,会造成什么后果呢?n这样导致这样导致k个可能样本的单元数不同个可能样本的单元数不同 n个或个或n+1个个n后果:导致偏差,此时的估计量不是无偏估计量后果:导致偏差,此时的估计量不是无偏估计量2024/4/19 周五统计学专业必修课3学分15举例说明:举例说明:nN=10,n=3,取,取k=3,则可能样本有,则可能样本有3个,分别为:个,分别为:Y1,Y4,Y7,Y10Y2,Y5,Y8Y3,Y6,Y9n其样本均值分别为:其样本均值分别为:n所有可能样本均值所有可能样本均值 的数学期望为的数学期望为2024/4/19 周五统计学专业必修课3学分164、改进的思路、改进的思路n为
15、了使样本均值成为总体均值的无偏估计量,可采用为了使样本均值成为总体均值的无偏估计量,可采用两种思路:两种思路:l改变样本的抽选方法改变样本的抽选方法 圆形圆形sy/循环等距循环等距sy 修正的线性等距修正的线性等距syl修正估计量的形式修正估计量的形式2024/4/19 周五统计学专业必修课3学分17(二)圆圈(二)圆圈sy/循环等距循环等距sy n1952年,拉希里提出的年,拉希里提出的1、目的:解决因、目的:解决因N不能为不能为n整除而导致的样本均值非总体均值的整除而导致的样本均值非总体均值的无偏估计的问题无偏估计的问题2、做法:、做法:l排序:将排序:将N个单元排成首尾相接的圆个单元排成
16、首尾相接的圆l取取k=N/n或四舍五入或四舍五入l在在1,N中,确定一个随机起点中,确定一个随机起点rl沿着圆圈走向,每沿着圆圈走向,每k个单元取一个,直到抽足个单元取一个,直到抽足n个为止个为止n这样获得的样本这样获得的样本l其包含的单元数其包含的单元数 均为均为nl样本可能数目样本可能数目 有有N个个 N个可能样本被抽中的概率相等个可能样本被抽中的概率相等l估计量无偏估计量无偏3、缺陷:比较麻烦、缺陷:比较麻烦 2024/4/19 周五统计学专业必修课3学分18举例:举例:圆圈圆圈sy的所有可能样本及样本均值的期望的所有可能样本及样本均值的期望Y1,Y4,Y7Y2,Y5,Y8Y3,Y6,Y
17、9Y4,Y7,Y10Y5,Y8,Y1Y6,Y9,Y2Y7,Y10,Y3Y8,Y1,Y4Y9,Y2,Y5Y10,Y3,Y62024/4/19 周五统计学专业必修课3学分19实践中实践中n实践中,实践中,n通常比较大通常比较大(n50),N则更大,所以,多则更大,所以,多一个少一个无关紧要,因此通常不考虑一个少一个无关紧要,因此通常不考虑N/n是不是整是不是整数的问题。为了处理方便,一律假定数的问题。为了处理方便,一律假定N能被能被n整除整除n实践中也常用一种简单的处理办法,就是,把不能整实践中也常用一种简单的处理办法,就是,把不能整除多余出来的部分直接除多余出来的部分直接“扔掉扔掉”,这会使总体
18、规模略,这会使总体规模略微缩减,但通常对估计效果的影响不大微缩减,但通常对估计效果的影响不大n所以,从这个角度也可以理解:所以,从这个角度也可以理解:n实践中的实践中的sy通常不是典型意义下的概率抽样,它有主观通常不是典型意义下的概率抽样,它有主观性性前面知识归纳前面知识归纳l什么是什么是sy?sy的三个核心点的三个核心点/步骤是什么?步骤是什么?n排序排序n确定起始单元确定起始单元n按某种规则抽取其他样本单元按某种规则抽取其他样本单元lSy的优点的优点n简便易行,表现在:抽样框简单,甚至不需要抽样框;非简便易行,表现在:抽样框简单,甚至不需要抽样框;非专业人士极易操作,甚至比专业人士极易操作
19、,甚至比srs还容易操作还容易操作n样本单元在总体中的分布比较均匀,样本单元在总体中的分布比较均匀,sy样本一般都具有较样本一般都具有较好的代表性,好的代表性,尤其尤其是在了解总体特征、有合适的辅助变量是在了解总体特征、有合适的辅助变量的信息可以利用时,采用有序的信息可以利用时,采用有序sy,可得到较高的估计精度,可得到较高的估计精度nSy的两个特殊问题的两个特殊问题/缺点缺点nsy的效果依赖于调查者对总体特征的了解的效果依赖于调查者对总体特征的了解n方差估计比较复杂方差估计比较复杂(8.3估计量方差的样本估计估计量方差的样本估计)nSy样本抽选的基本方式样本抽选的基本方式n直线直线sy和圆圈
20、和圆圈sySy样本样本抽选方式抽选方式2024/4/19 周五统计学专业必修课3学分21三、总体单元的排序三、总体单元的排序 回答回答“如何排序如何排序”的问题的问题n总体各单元的排列顺序,与总体各单元的排列顺序,与sy的结果有着密切的关系的结果有着密切的关系n几种常见的排序情况:几种常见的排序情况:1、总体单元随机排序、总体单元随机排序按无关标志排序按无关标志排序/无序无序syn即各单元的排序与所研究的目标量无关,比如即各单元的排序与所研究的目标量无关,比如n城市住户调查中,按住户的登记顺序或姓氏笔画或门牌号城市住户调查中,按住户的登记顺序或姓氏笔画或门牌号码等排序码等排序n农产量调查中,总
21、体单元按地理区域排序农产量调查中,总体单元按地理区域排序n对学生的调查按学号排序等对学生的调查按学号排序等n注意两点:注意两点:n所谓所谓“无关无关”:没有必然联系没有必然联系,即没有直接关系或关系很,即没有直接关系或关系很小小n采用无关标志排序的总体实际上是一个采用无关标志排序的总体实际上是一个随机总体随机总体,这时的,这时的sy等同于等同于srsn确定估计量形式和计算抽样误差时都可视同确定估计量形式和计算抽样误差时都可视同srs2024/4/19 周五统计学专业必修课3学分222、总体单元的排序与其目标量大小有关、总体单元的排序与其目标量大小有关 按有关标志排序按有关标志排序/有序有序Sy
22、n即排序标志与目标量有着密切的关系。比如:即排序标志与目标量有着密切的关系。比如:n农产量调查中,选择历史产量或历史产量的平均数为排序农产量调查中,选择历史产量或历史产量的平均数为排序标志标志n优点优点:n可充分利用总体的有关信息,使抽取的样本更具代表性,可充分利用总体的有关信息,使抽取的样本更具代表性,减少抽样误差,提高抽样效率减少抽样误差,提高抽样效率n同时,可行性同时,可行性/可操作性也很强,因为我国现行的统计制可操作性也很强,因为我国现行的统计制度可以提供各种有关标志排序的抽样框度可以提供各种有关标志排序的抽样框n两种主要类型:两种主要类型:n(1)周期性排序周期性排序n(2)线性趋势
23、排序线性趋势排序2024/4/19 周五统计学专业必修课3学分23(1)周期性排序周期性排序 呈周期性变化的总体的呈周期性变化的总体的syn即总体各单元的排序与目标量值有某种周期性的关系即总体各单元的排序与目标量值有某种周期性的关系n此时,总体呈周期性波动态势,比如正余弦曲线的态势此时,总体呈周期性波动态势,比如正余弦曲线的态势n如果不了解这种波动规律,而恰好选择的抽样间隔即周如果不了解这种波动规律,而恰好选择的抽样间隔即周期的长度,就会出现样本各单元的标志值都是各周期同期的长度,就会出现样本各单元的标志值都是各周期同一相位上的数字,这个数字相同或比较接近一相位上的数字,这个数字相同或比较接近
24、n比如,在对某商场日销售额进行比如,在对某商场日销售额进行sy估计时,如果抽样估计时,如果抽样间隔设定为间隔设定为7天,就会出现样本日销售额正好都是某天,就会出现样本日销售额正好都是某一天的情况一天的情况n后果:后果:n此时的此时的sy样本对总体的代表性很差样本对总体的代表性很差n处理方式处理方式:n抽样间隔选择半周期或半周期的奇数倍抽样间隔选择半周期或半周期的奇数倍n一些统计学家甚至认为:当怀疑某种现象的变动有周一些统计学家甚至认为:当怀疑某种现象的变动有周期性的趋势时,不宜采用线性期性的趋势时,不宜采用线性sy的方式的方式2024/4/19 周五统计学专业必修课3学分24(2)线性趋势排序
25、线性趋势排序 呈线性趋势变化的总体的呈线性趋势变化的总体的syn当总体各单元的排序按某相关标志排序后呈现一种线性当总体各单元的排序按某相关标志排序后呈现一种线性趋势时,采用线性趋势时,采用线性sy,已经证明:,已经证明:n其抽样估计精度虽优于其抽样估计精度虽优于srs,但不如,但不如stn原因:原因:n对线性趋势总体,采用线性对线性趋势总体,采用线性sy,可能会使所抽样本产,可能会使所抽样本产生一种生一种“趋向性趋向性”偏差偏差n处理方法:处理方法:n在总体呈现这种在总体呈现这种“线性趋势线性趋势”或或“单调上升或单调下单调上升或单调下降趋势降趋势”时,采用中心位置时,采用中心位置sy或对称或
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- zCH 系统抽样
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【胜****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【胜****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。