社会调查方法03抽样一.pptx
《社会调查方法03抽样一.pptx》由会员分享,可在线阅读,更多相关《社会调查方法03抽样一.pptx(69页珍藏版)》请在咨信网上搜索。
1、 第二章第二章 抽抽 样样 第一节第一节 抽样概述抽样概述一.抽样的含义l抽样:从总体中按一定规则抽取部分单位的过程。二.抽样的分类l非概率抽样:依据调查目的和对调查对象的分析,主观有意识地在由研究对象构成的总体中选择样本。l概率抽样:依据概率理论计算抽样误差,按照随机原则选择样本,对总体进行推断,完全不带调查者的主观意识。三.抽样的基本术语l个体与抽样单位(SamplingUnit):个体是指一次直接的抽样所使用的基本单位,它往往与抽样单位相同,但并不完全等同;l总体(population):所有调查对象的集合体。它包括研究总体和调查总体,二者也不能完全等同;l总体规模:总体中含有的抽样单位
2、的数目(N)。l样本(Sample):从总体中抽取出的一部分抽样单位的集合体。l样本容量:样本中含有的抽样单位的数目(n)。抽抽抽抽样样样样框框框框(Sampling(Sampling Frame)Frame):一一一一次次次次抽抽抽抽样样样样时时时时总总总总体体体体中中中中所所所所有有有有抽抽抽抽样样样样单单单单位位位位的的的的名单。名单。名单。名单。总总总总体体体体参参参参数数数数值值值值(Parameter Parameter):关关关关于于于于总总总总体体体体中中中中某某某某一一一一变变变变量量量量取取取取值值值值的的的的综综综综合合合合描描描描述。述。述。述。样本统计值样本统计值样本
3、统计值样本统计值(Statistic)(Statistic):关于样本中某一变量取值的综合描述。:关于样本中某一变量取值的综合描述。:关于样本中某一变量取值的综合描述。:关于样本中某一变量取值的综合描述。抽抽抽抽样样样样误误误误差差差差(sampling sampling errorerror):样样样样本本本本统统统统计计计计值值值值和和和和总总总总体体体体参参参参数数数数值值值值之之之之间间间间的差异。的差异。的差异。的差异。不可避免不可避免不可避免不可避免 置置置置信信信信水水水水平平平平(confidence confidence levellevel):总总总总体体体体参参参参数数数
4、数值值值值落落落落在在在在样样样样本本本本统统统统计计计计值值值值某某某某一正负区间的概率。一正负区间的概率。一正负区间的概率。一正负区间的概率。置置置置信信信信区区区区间间间间(confidence confidence intervalinterval):在在在在一一一一定定定定的的的的置置置置信信信信水水水水平平平平下下下下,样样样样本本本本统计值与总体参数值偏差的最大允许范围。统计值与总体参数值偏差的最大允许范围。统计值与总体参数值偏差的最大允许范围。统计值与总体参数值偏差的最大允许范围。?l为什么要知道一个人的血液情况,只需要抽一为什么要知道一个人的血液情况,只需要抽一点点血来化验就
5、可以了?点点血来化验就可以了?四.抽样的基本规律l随随机机原原则则(random principle):在完全排除主观上人为选择的前提下,使总体中每一个单位有相同被抽中的机会。概率抽样?l一个新闻记者就市民关心的问题,在街头碰到一个新闻记者就市民关心的问题,在街头碰到谁调查谁,是不是遵循了随机原则。谁调查谁,是不是遵循了随机原则。四.抽样的基本规律l大大数数规规律律:大量重复观察的结果的平均数几乎接近某个确定的数值。试验者试验者抛硬币的次数抛硬币的次数N正面次数正面次数n出现正面的机会出现正面的机会n/N蒲丰蒲丰404020480.5069皮尔逊皮尔逊1200060190.5016皮尔逊皮尔逊
6、24000120120.5005大数规律的抛币实验五五.抽样的基本程序抽样的基本程序 l1.确定总体确定总体.l2.确定抽样框确定抽样框l3.设计和选取样本设计和选取样本l4.对样本进行评估对样本进行评估1.确定总体确定总体l根据调查目的,确定调查对象的范围,包括时间,地点,和人物。并排列调查总体中所有能找到的调查对象。美国美国文学摘要文学摘要的失败的失败2.确定抽样框确定抽样框操作层面操作层面对于不同类型的总体抽样框的形式也有多种。3.设计和选取样本设计和选取样本l确定样本的数量1.抽样误差2.调查成本l选择抽样的具体方法:不同的抽样方法产生的样本代表性不同。先抽好样本再调查边抽部分样本边调
7、查 4.对样本进行评估对样本进行评估l初步检查样本的代表性,避免因失误使样本偏差太大l收集若干容易得到的资料作为总体和样本之间的比较方法。五.抽样的特点 l1.更少投入l2.速度快,周期短l3.应用范围广l4.设置较多的较复杂的调查项目,并能集中时间和精力作详细的分析,可获得内容丰富的资料l5.准确性较高l6.由样本情况来推断总体情况抽样成功的依据l样本能代表总体l能判断抽样误差第二节 概率抽样l概率抽样:总体内的所有个体具有相同的不为零被抽入样本的机会。l等概率抽样与不等概率抽样一一.简单随机抽样简单随机抽样(Simple Random Sampling)l1.特点l简单随机抽样对总体中的所
8、有个体按完全符合随机原则的特定方法抽取样本,即抽样时不进行任何分组,排列,使总体中的任何个体都同样有被抽取的平等机会。l要保证抽样框的充分性,如果某些个体被漏掉,它们就丧失了进入样本的机会,就破坏了随机原则。2.2.方法方法l 总体较小时:抓阄,抽签法l如果要你从3000总体中抽取100个,用抽签法如何?总体较大时:随机数字表l随机数法的步骤:l1.确定总体确定总体N,并编号(,并编号(N的位数决定所有号码的位数,的位数决定所有号码的位数,如如N=1000,编号为,编号为0001,00021000)l2.随意指出随即表上其中一个同位数码随意指出随即表上其中一个同位数码起点(如起点(如0556)
9、l3.确定选择规则(上确定选择规则(上-下,左下,左-右或其他规则),依次选右或其他规则),依次选择足够样本择足够样本规则一旦确定,就不变,碰到大于总规则一旦确定,就不变,碰到大于总体的随机数和重复的随机数,跳过(舍去)体的随机数和重复的随机数,跳过(舍去)2.2.评价评价优点:概率抽样的理想类型,无偏见,简单易行,能对总体进行推断,误差小。缺点:1.需要为总体每个要素编号,当总体所含个体的数目太多时采用这种方法费时费力;2.总体内分类明显时,这种抽样无法按类别特征自动分配样本数,若想保证样本的代表性,必须增大样本量,使工作量增大二.分层抽样(Stratified Sampling)l1.分层
10、抽样的内涵:l分层抽样是将总体N依照某一种或某几种特征分为几个子总体(层),然后从每一层中采取简单随机抽样或等距抽样方式抽取一个个子样本n1,n2将这些子样本合在一起即为总体样本n。使用什么分层变量?一般是选择与调查目标变量高度相关的变量。要协调层的数量和每层样本量 分层抽样适用于总体数目较多,异质,一个或多个变量可能影响调查结果的情况,且对所研究的总体有详细的名单。分层后,每层同质,层之间不同质,然后在每层按照比例抽。分分类类随机随机抽样抽样N10000N11800N23500N33000N41700n1 18n2 35n330n4 17n100总体总体层层(互不重(互不重叠)叠)子样本子样
11、本样本样本确定分层特征 2.分层抽样的种类:划分标准:各层子样本容量的确定方式(一)按比例分层抽样 按比例分层抽样要求:各子样本在总样本中所占比例=各层在总体中所占的比例简单便利,常用(二)非比例分层抽样(最优分层抽样)根据其他因素(如各层平均数或标准差的大小等),调整各层样本的单位数。各子样本在总样本中所占比例各层在总体中所占的比例,不同层的单位入样的概率不同,是不等概率抽样。对总体中规模太小的层作比较研究 不等概率抽样的后期统计一般要做特殊处理。l举例:举例:20000户居民,按经济收入高低分类,高收户居民,按经济收入高低分类,高收入居民入居民4000户,占总体户,占总体20%;中等收入;
12、中等收入12000户,户,占总体占总体60%;低收入户;低收入户4000户,占总体户,占总体20%,从中,从中抽取抽取200户,进行购买力调查。户,进行购买力调查。l等比例分层抽样等比例分层抽样高收入层样本数:高收入层样本数:200 20%=40户户中收入层样本数:中收入层样本数:200 60%=120户户低收入层样本数:低收入层样本数:200 20%=40户户分层抽样的适用性分层抽样的适用性l1当一个总体内部分层明显时,分层抽样能当一个总体内部分层明显时,分层抽样能够克服简单随机样和等距抽样的缺点。够克服简单随机样和等距抽样的缺点。l2分层抽样可以提高总体参数估计的精确度。分层抽样可以提高总
13、体参数估计的精确度。l3有些研究不仅要了解总体的情况,而且还有些研究不仅要了解总体的情况,而且还要了解某些类别的情况。要了解某些类别的情况。l4便于行政管理。同一层可看作一个总体,便于行政管理。同一层可看作一个总体,因此每层可由专人进行管理。因此每层可由专人进行管理。l某高一学生共某高一学生共500人,经调查,喜欢数学的学生占全体学生的人,经调查,喜欢数学的学生占全体学生的30,不喜欢数学的人数占不喜欢数学的人数占40,介于两者之间的学生占,介于两者之间的学生占30。为了考察。为了考察学生的期中考试的数学成绩,如何用分层抽样抽取一个容量为学生的期中考试的数学成绩,如何用分层抽样抽取一个容量为5
14、0的的样本样本l某公司有某公司有500人,其中人,其中35岁以下的岁以下的125人,人,3549的的280人,人,50以上以上的的95人。为了调查员工的身体健康情况,从中抽取人。为了调查员工的身体健康情况,从中抽取100人,怎样用人,怎样用分层抽样抽?分层抽样抽?l某大学食堂为了了解新生的饮食习惯,以分层抽样方式从某大学食堂为了了解新生的饮食习惯,以分层抽样方式从1500名新名新生中抽取生中抽取200人进行调查,新生中南方学生人进行调查,新生中南方学生500人,北方学生人,北方学生800人,人,西部学生西部学生200人,如何抽?人,如何抽?l某市电视台在网上征集节目现场观众,报名的总人数某市电
15、视台在网上征集节目现场观众,报名的总人数12000人,来人,来自自4城区,东城区城区,东城区2400人,西城区人,西城区4605人,南城区人,南城区3795人,北城区人,北城区1200人。用分层抽样抽取人。用分层抽样抽取60人参加,如何抽?人参加,如何抽?三三.系统抽样系统抽样(Systematic Sampling)(等距抽样(等距抽样)(一)直线等距抽样(抽样间距K为整数)1.将总量的所有个体按一定顺序排列。2.计算抽样间距。抽样间距是由总体数目与样本数目决定的。如果总体数为N,样本数为n,则抽样间距应是:N K=n 3.在1K范围内,随机抽取一个起点数r 4.自r开始,每隔K个单位抽取一
16、个单位,依次抽取的单位号码为r,r+k,r+2k,r+(n-1)k特点:每一列被选中的概率相同(图)直线等距抽样练习题直线等距抽样练习题:某大学有12000名学生,欲了解其生活态度,决定采用系统抽样的方法从中抽查200名学生,用简单随机抽样的方法抽出第一名学生序号为12,请计算第十位,第十五位学生的序号是多少?l(二)循环等距抽样(k不为整数)方法1.1.将总体N首尾相连,N K=,取接近K的整数;2.随机起点r从1-N中随机抽取 n方法2.调整直线等距抽样1.将K的小数点后移,便为整数K2.确定整数的随机起点r,从10-K中选3.确定非整数的随机起点r,即将r的小数点移回来4.从r开始,每隔
17、K各单位抽取一个单位5.再将所有抽取的号码的小数点略去特点:所有单位有相同的中选概率1/K 等距抽样与简单随机抽样相比,样本分布更为等距抽样与简单随机抽样相比,样本分布更为均匀,抽样误差更小均匀,抽样误差更小 注意注意:等距抽样是以总体的随机排列为前提的,等距抽样是以总体的随机排列为前提的,如果总体的排列出现有规律的分布时,会使等距抽如果总体的排列出现有规律的分布时,会使等距抽样产生极大的误差样产生极大的误差,降低样本的代表性降低样本的代表性 等距抽样最适用于同质性较高的总体,当总体等距抽样最适用于同质性较高的总体,当总体内个体类别之间的数目悬殊过大时,样本的代表性内个体类别之间的数目悬殊过大
18、时,样本的代表性可能较差。在这种情况下应采用另一种分层抽样方可能较差。在这种情况下应采用另一种分层抽样方法。法。系统抽样练习系统抽样练习l某杂志对其订阅者进行一次邮寄访问,以更好某杂志对其订阅者进行一次邮寄访问,以更好地了解读者市场。地了解读者市场。N=150万(万(1500000),),n=1500。如何抽取样本?如何抽取样本?练习l从编号从编号1到到900的总体中用系统抽样的办法抽取的总体中用系统抽样的办法抽取9个样本个样本l某产品共有某产品共有2563件,产品按出厂顺序编号,号码件,产品按出厂顺序编号,号码从从1到到1563,检测员要从中抽取,检测员要从中抽取15件产品进行检件产品进行检
19、测,请给出一个系统抽样方案。测,请给出一个系统抽样方案。l要考察某商场要考察某商场2006年的日销售额,从一年时间中年的日销售额,从一年时间中抽取抽取52天的销售额作为样本,请给出你的系统抽天的销售额作为样本,请给出你的系统抽样方案,并说说你的抽样方案的优点和不足样方案,并说说你的抽样方案的优点和不足四四.整群随机抽样整群随机抽样(Cluster Sampling)l 将总体按照某种标准分为i个群(互不重叠),每个群作为一个抽样单位,用随机的办法从中抽取若干群,将抽出的群中所有个体合在一起作为总体的样本。l 整群抽样与分层抽样有相似之处,第一步都是按某种标准将总体划分为一些子群。l 但是分层抽
20、样是在所有子群中均抽取一个子样本,作为总体样本的一部分,而整群抽样是抽取若干子群,并将抽出的子群中全部个体作为样本,总体样本只分布在几个群中。所以整群抽样的分群标准要求群间异质性低,群内异质性高。适用于界定不清的总体。划分划分子群子群随机随机抽样抽样N5000R153R250R358R448R1 53R448R3352R98 50n250总体总体群群(互不重(互不重叠)叠)子群子群样本样本确定分群特征R11047R13045l整群抽样评价整群抽样评价l优点:优点:节省人力物力;节省人力物力;可以在没有总体名单即抽样框的条件下进行,可以在没有总体名单即抽样框的条件下进行,扩大抽样的范围。扩大抽样
21、的范围。l缺点:缺点:样本的代表性较差,与其他方法比,在样本样本的代表性较差,与其他方法比,在样本数量相同的情况下,抽样误差比较大。数量相同的情况下,抽样误差比较大。比较分层抽样和整群抽样比较分层抽样和整群抽样分层抽样整群抽样样本样本每层均要选取子样本作为总样每层均要选取子样本作为总样本的一部分本的一部分只选择某几个子群作为整只选择某几个子群作为整体的代表体的代表 层与层的关层与层的关系系层的划分具有较高的代表性,层的划分具有较高的代表性,即层之间异质性高即层之间异质性高 群间异质性低群间异质性低层内性质层内性质层内则尽可能同质层内则尽可能同质 群内异质性高群内异质性高变量选择变量选择研究变量
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 社会调查 方法 03 抽样
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【精***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【精***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。