抽样调查-第一章.ppt
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样调查 第一章
- 资源描述:
-
1抽样调查课抽样调查课-第一课时第一课时单位:浙江财经学院数统学院课程:抽样调查课教师:张锐2信息社会信息社会一、什么是信息二、信息如何采集三、信息如何存储和传播四、信息如何处理五、信息如何解释3一、什么是信息一、什么是信息如何给信息下个定义?差异就是信息信息就是价值4二、信息如何采集二、信息如何采集非统计方法记者新闻采访仓库管理员的统计统计方法随机概率保证5三,信息如何存储和传播三,信息如何存储和传播计算机 信息存储的介质,也是信息革命的开端。网络 信息传播渠道的拓宽。6四、信息如何处理四、信息如何处理确定性信息 简单记录 汇总 统计局 会计非确定性信息 统计方法处理 模糊数学处理 灰色系统处理7五,信息如何解释五,信息如何解释数学与哲学解释自然科学解释物理化学社会科学解释宏观经济学(GDP核算)博弈论(拍卖理论)系统科学控制学信息学8 统计时代信息的采集 统计方法,是信息采集最合理最合理的方法。信息的处理 非确定性社会下,统计方法是信息处理最最常用常用的方法。9统计学统计学一、统计学的历史二、数理统计概况三、统计学的应用四、市场调研公司概况五、市场调研的流程六、市场调研公司的人员构成七、统计在在市调的应用10一、统计学的历史一、统计学的历史人口普查-罗马帝国时代,恺撒大帝为了炫耀国家实力,进行了有史以来第一次的人口普查。经济统计开始逐步发展起来。随机变量的引入让统计由数数演变到了一门数学科学。Fisher对统计推断的研究,开辟出了现代数理统计这一学科。11二、数理统计学二、数理统计学估计假设检验数据的收集(抽样调查)数据的分析处理n 断面数据(回归分析,计量经济学)n 时间数据(随机过程,时间序列)n多纬度数据(多元统计)12三、统计学的应用三、统计学的应用政府机构(统计局等)金融机构(银行、证券、保险)研究所调研公司大型外资消费企业13四、市场调研公司四、市场调研公司 无论是专业市场调研公司,还是一些企业的市场调研部都细分为两个部门l调研部 从事数据采集l分析部 从事数据分析14五、市场调研公司的人员构成五、市场调研公司的人员构成访问员督导总督导数据分析员15六、市场调研公司的流程六、市场调研公司的流程确立研究对象 样本量的确定 抽选方案的设计 费用的计算 问卷的设计 现场执行质量的控制 数据分析16七、统计在市场调研中的应用七、统计在市场调研中的应用样本量的确定抽选方案的设计质量的控制数据分析频数分析交叉分析实验设计和方差分析主成分和因子分析17抽样调查课程概述抽样调查课程概述一、抽样调查和抽样技术二、课程要求三、撰写调查报告四、调查报告的四个部分五、课程的主要内容六、教材资料七、模型结构18一、抽样调查和抽样技术一、抽样调查和抽样技术抽样调查和抽样技术抽样调查市场调查方法与技术 中国人民出版社 简明 金勇进 蒋妍 等抽样技术 抽样技术 中国人民出版社 金勇进 蒋妍 李序颖等19二、课程要求二、课程要求掌握概率抽样的方法、理论了解和掌握抽样的公式及部分公式的推导会写一份调查报告会使用不同的软件进行分析20三、调查报告的格式三、调查报告的格式论文格式报告格式21四、调查报告的四个部分四、调查报告的四个部分调查目的抽样方案数据描述、分析建议22经济经济五、课程的主要内容五、课程的主要内容医学医学工程工程.生活生活计量计量第第第第 1 1 1 1 章章章章 绪论绪论绪论绪论第第第第 2 2 2 2 章章章章 简单随机抽样简单随机抽样简单随机抽样简单随机抽样第第第第 3 3 3 3 章章章章 分层随机抽样分层随机抽样分层随机抽样分层随机抽样第第第第 4 4 4 4 章章章章 等概率整群抽样和多阶段抽样等概率整群抽样和多阶段抽样等概率整群抽样和多阶段抽样等概率整群抽样和多阶段抽样第第第第 5 5 5 5 章章章章 不等概抽样不等概抽样不等概抽样不等概抽样第第第第 6 6 6 6 章章章章 系统抽样系统抽样系统抽样系统抽样第第第第 10 10 章章章章 调查中的非抽样误差调查中的非抽样误差调查中的非抽样误差调查中的非抽样误差穿穿穿穿 插插插插 具体的抽样调查的实例具体的抽样调查的实例具体的抽样调查的实例具体的抽样调查的实例共计共计共计共计51515151学时学时学时学时 23经济经济管理管理医学医学工程工程.生活生活计量计量六、教材资料六、教材资料指定教材指定教材指定教材指定教材 抽样技术抽样技术 金勇进等金勇进等参考书籍参考书籍参考书籍参考书籍抽样调查理论与方法抽样调查理论与方法抽样调查理论与方法抽样调查理论与方法冯士雍冯士雍冯士雍冯士雍 倪加勋倪加勋倪加勋倪加勋 邹国华等邹国华等邹国华等邹国华等 中国统计出版社中国统计出版社中国统计出版社中国统计出版社抽样调查的理论与方法抽样调查的理论与方法抽样调查的理论与方法抽样调查的理论与方法施锡铨施锡铨施锡铨施锡铨 上海财经大学出版社上海财经大学出版社上海财经大学出版社上海财经大学出版社抽样调查抽样调查抽样调查抽样调查L.Kish L.Kish 中国统计出版社中国统计出版社中国统计出版社中国统计出版社调查技能教程调查技能教程调查技能教程调查技能教程加拿大统计局国家统计局统计教育中心、加拿大统计局国家统计局统计教育中心、加拿大统计局国家统计局统计教育中心、加拿大统计局国家统计局统计教育中心、国际合作司国际合作司国际合作司国际合作司统计学统计学统计学统计学应用抽样技术应用抽样技术应用抽样技术应用抽样技术李金昌李金昌李金昌李金昌 科学出版社科学出版社科学出版社科学出版社抽样技术及其应用抽样技术及其应用抽样技术及其应用抽样技术及其应用杜子芳编著杜子芳编著杜子芳编著杜子芳编著 清华大学出版社清华大学出版社清华大学出版社清华大学出版社 SpringerSpringer,网络资源网络资源网络资源网络资源 24七、模型结构七、模型结构统计推断的模型结构抽样调查的模型结构回归分析、计量经济学的模型结构时间序列的模型结构25统计推断的模型结构统计推断的模型结构26抽样调查抽样调查27回归分析、计量经济学回归分析、计量经济学28抽样调查的基本概念抽样调查的基本概念一、抽样调查和普查 二、概率抽样和非概率抽样三、等概率抽样和不等概率抽样四、主要的研究指标五、如何评价抽样的好坏六、如何抽到好的样本29一,抽样调查和普查一,抽样调查和普查一、定义二、区别三、抽样调查和普查的选择抽样调查只调查的是总体的一部分单元收集信息,而普查需要调查总体的所有单元来收集信息。取决于多方面的因素,包括预算,要求的时限,总体的大小等等选择抽样调查的最主要原因是抽样调查能在充分满足客户所需要信息质量的前提下,更快更节省。对于普查而言,抽样调查规模小,容易监控。当然有些情况普查会更好的。30抽样调查与普查抽样调查与普查抽样调查与普查抽样调查与普查 抽样调查的作用抽样调查的作用 抽样调查的应用抽样调查的应用 我国的统计调查体系我国的统计调查体系31抽样调查与普查(抽样调查的作用)抽样调查与普查(抽样调查的作用)抽样调查与普查(抽样调查的作用)抽样调查与普查(抽样调查的作用)一、节约费用:统计调查有一个经济效益问题,抽样调查的数据来源只是总体的一小部分,能节约调查的人力、物力和财力,所以调查费用低。例如,美国政府在进行最重要的调查时,使用的样本常在105,000人左右(美国人口为1亿3千万左右),即 1240个人中抽一个人。二、时效性强:抽样收集的数据远远少于全面普查的数据,需要处理的数据自然就比较少。这样,由抽样调查提供的数据资料和决策、预测等往往比全面普查更为及时。在迫切需要有关信息时,这一点非常重要。三、可以承担全面调查无法承担的项目 对那些不可能进行全面观察的,又需要了解全面情况的客观对象(总体),只能抽样。a 所研究的个体是无限的。比如想知道大气的污染程度。b.观察或测试是具有破坏性的。如测试一批显象管的寿命。四、能提高调查的质量,有较高的精确度为什么?32抽样调查与普查抽样调查与普查抽样调查与普查抽样调查与普查错觉错觉:抽样调查是一种非全面调查抽样调查是一种非全面调查,抽样调查当然不如全面调查准确抽样调查当然不如全面调查准确.抽样调查是用局部来推断总体,当然存在抽样误差。但是调查的误差是多方面的,任何一项调查都存在观察或调查误差,也有可能发生遗漏和重复。因此,调查数据的质量更加重要。一个错误的数据比没有更糟。在抽样人员上,全面培训大量人员比较困难,但是小批的工作人员是完全可以的,这就保证了质量。基本点基本点科学的抽样手段科学的抽样手段、确保质量的调查数据确保质量的调查数据、精确严精确严格的统计计算程序格的统计计算程序。一项经科学设计并严格实施的抽样调查完全有可能获得比全面一项经科学设计并严格实施的抽样调查完全有可能获得比全面调查(普查)更为准确、更为可靠的结果。调查(普查)更为准确、更为可靠的结果。33抽样调查与普查的关系抽样调查与普查的关系抽样调查与普查的关系抽样调查与普查的关系抽样调查和普查的关系是相互补充,相辅相成。抽样调查和普查的关系是相互补充,相辅相成。抽样调查并不可以替代普查。普查收集的资料比较容易为大众所接受,能较好的获得公众的支持,可以取得小单位的资料等等。抽样调查作为普查的补充:我国的人口调查是十年一次的普查和每年一次的抽样调查用抽样调查对全面统计资料进行评估和修正利用抽样调查,提前获得总体目标量的估计普查为抽样框提供资料34抽样调查的应用抽样调查的应用抽样调查的应用抽样调查的应用1.人口调查人口调查 人口调查是抽样调查最早应用的领域。2.经济调查经济调查 如对各类产品、商品的市场调查和消费行为调查等等3.社会调查社会调查 包括公众和民意调查等等4.卫生调查卫生调查5.环境资源调查等等环境资源调查等等35我国的统计调查体系我国的统计调查体系我国的统计调查体系我国的统计调查体系 以必要的周期性普查为基础以必要的周期性普查为基础;以经常性的抽样调查为主体以经常性的抽样调查为主体;辅之以重点调查、科学推算和有限的全面报辅之以重点调查、科学推算和有限的全面报 表综合运用表综合运用我国的统计调查体系我国的统计调查体系36二、概率抽样和非概率抽样二、概率抽样和非概率抽样抽样框名录框区域框自然框抽样单元 是构成抽样框的基本元素37概率抽样按一定的概率以随机原则抽取样本。每个单元被抽中的概率是已知的。估计量不仅与样本单元的观测值有关,也与其入样概率有关。非概率抽样方便抽样自愿样本38非概率抽样例子非概率抽样例子例子一 从实验室中一个装有100只兔子的大笼子里抓10只兔子做实验,不经任何有意识的选取,抓到哪只就算哪只,抓满10只为止。例子二 将笼子里的100只兔子编上1100号,任意列出10个数字,相应号码的兔子作为实验用的兔子。39三、等概率抽样和不等概率抽样三、等概率抽样和不等概率抽样例子一全班有个人,按学号进行编号,从中随机抽取一个人。研究这个人的身高。例子二全班个人,按学号进行编号,以号代表号同学,从中随机抽取一人,研究这个人的身高。40四、主要的研究指标四、主要的研究指标总体总量总体均值总体比例总体比率41研究目标量例子研究目标量例子判断下面要估计的总体目标量分别是什么类型。测试一名大学生的英语词汇量调查城市居民家庭平均用电量估计空气中氮氧化合物的含量估计湖中鱼的数量估计居民家庭用于做饭菜及饮用的用水量占家庭总用水量的比重估计婴儿出生性别比42五、如何评价样本的好坏五、如何评价样本的好坏误误 差差非抽样误差非抽样误差抽样误差抽样误差 由于抽样造成的误差,由于抽样造成的误差,由于用样本估计总体由于用样本估计总体而产生的误差。而产生的误差。调查误差调查误差不完整的抽样框引起的误差不完整的抽样框引起的误差不回答误差不回答误差由于填写或录入调查数据中的谬误而产生的误差由于填写或录入调查数据中的谬误而产生的误差43 抽样误差产生的原因抽样误差产生的原因 样本只是总体的一部分,用局部数据作为整体数据的估计不可能完全正确。对任何一种抽样方案,可能的样本会有很多,而实际抽到的只是一个样本。因此抽到哪一个样本完全是随机的、偶然的。如果抽到的是另一个样本,对总体的估计就会不同。这就是抽样误差产生的根本原因。只要是抽样调查,这个误差是不可避免的。但与非抽样误差不同的是,抽样误差是能够计量计量的,即可用各种量值来表示,而且它可以得到控制控制,即只要愿意,人们可以将抽样误差控制在任意小的范围内。原因在于抽样调查直接与样本量有关。44 抽样误差与样本量抽样误差与样本量 抽样误差 样本量45 抽样误差与样本量抽样误差与样本量样本量越大越好?样本量给定的情况下,如何衡量抽样误差,选择抽样方法呢?未必。未必。抽样误差虽然在开始时随样本增加而缩小,但在一定阶段后便趋于稳定。在经过一定阶段后,再努力减少抽样误差通常是不合算的。所以,过了这个阶段,只要稍微降低一点精度,就可以省下可观的成本。需要考虑抽样方案的设计,通常用抽样的方差与标准差等等度量抽样误差。46 非抽样误差与样本量非抽样误差与样本量 至于非抽样误差,其特性恰好和抽样误差相反,是随样本增大而随样本增大而增大增大。因为抽样调查的访问和资料整理都比普查易于进行,因此非抽样误差远小于普查。有时,普查中的非抽样误差竟然大于抽样调查中的抽样误差与非抽样误差的总和,此时更值得使用抽样调查。当然非抽样误差 在调查的各个环节规定并实施质量保证措施才能使非抽样误差控制在一个比较理想的水平。4748用均方误差评价抽样的好坏用均方误差评价抽样的好坏均方误差(平均平方误差)均方误差(平均平方误差)(mean square error):例子49=由均方误差的分解可知,均方误差可分解为估计量的方差和偏倚的平方。通常情况下,我们用均方误差的大小来衡量抽样方案设计的优劣。由于偏倚指的是系统误差,所以用估计量的方差衡量抽样误差的大小。当然当估计量是无偏无偏时,均方误差就等于估计量的方差了。50抽样误差的度量抽样误差的度量 样本的估计量与估计值样本的估计量与估计值样本的估计量?样本的估计量?样本的估计值?样本的估计值?一个估计量的(抽样)分布?一个估计量的(抽样)分布?样本的函数基于某个特定的样本在使用相同的抽样设计,从同一个总体中抽取所有可能的样本的估计值的分布。估计量的抽样分布依赖与抽样设计即采取何种具体的概率抽样方式。还有估计量的具体形式。估计量的抽样分布对于确定估计量的性质比如偏倚和抽样方差等非常重要。我们希望所得的估计量应该具有哪些性质呢?我们希望所得的估计量应该具有哪些性质呢?5152估计量的偏性与均方误差估计量的偏性与均方误差设总体的某个待估参数为,用样本数据计算的一个统计量 作为 的估计(estimator)。用 估计 的实际误差是,且未知 a)偏倚偏倚(Bias):称为估计量的偏倚,记为 b)均方误差(平均平方误差)均方误差(平均平方误差)(meansquareerror):称为均方误差。由于 未知(在通常情况下)但它可分解为:注意到,偏倚由于正负的抵消不足以反映误差的大小。因而我们考虑也就是平均平方误差或均方误差53问题:“多大的标准差是可以接受的?”例如,标准差等于100用来测度人的体重可能很大,但是用来测度年收入就显得不是很大。问题:如何比较不同量纲单元的样本估计值的抽样误差时?F变异系数变异系数;估计值的标准差与估计值本身之比,估计值的标准差与估计值本身之比,经常见到报纸采用如下方式报道调查结果:“根据一项最新的调查,15%的渥太华市民每周都参加宗教活动。这个结果是基于一个1345名市民的样本得出的,在95%的置信水平下,误差在正负3个百分点之内。”这段话有什么含义?这段话有什么含义?它告诉我们,每周都参加宗教活动的市民的真实比例在15%+-3%的范围内。换句话说,误差限误差限是+3%,或简单地说成3%,此时置信区间置信区间(12%,18%)。误差限总是伴随一个置信水平,它表示置信区间的可靠程度。在这个例子中,置信水平是95%,它表示:如果调查重复进行,那么100次中将有95次,所得的置信区间覆盖总体的真值。-误差限误差限-置信区间置信区间5455 实际中,有个人类学家要了解某一个小岛的居民,除了其他研究内容外,想估计一下居民的血型为o型的人所占的比率。于是统计学家问,你要达到多少的精确度?他回答说,只要百分比有不到5%的出入就满意了。统计学家指出,除非你对每个人进行计量,不然我们不能绝对保证精确度是在5%以内的,无论去多大的样本,总有机会抽到一个倒霉的样本,它的误差比所需要的5%要大。于是,人类学家就冷淡的说,我知道的,我愿意有二十五分之一的机会遇到一个倒霉的样本。565758置信度的含义?59费用与精度费用与精度 一个好的抽样设计应尽量考虑到精度与费用两个因素。对于具体的抽样设计应做到u 在固定费用的限制下使精度最高在固定费用的限制下使精度最高u要求达到精度的条件下,使调查的总费用最省要求达到精度的条件下,使调查的总费用最省 这样的设计称为最优设计,最优设计的效率最高抽样调查的精度取决于误差的大小,主要是取决于抽样误差的大小。在对可用估计量,样本量较大的时候抽样误差取决于方差(或标准差)的大小。影响方差的最主要的因素就是样本量,样本量与调查费用直接相关。样本量越大,费用越高。另外一个影响费用和精度的因素就是抽样方法和估计方法。六、如何抽到好的样本六、如何抽到好的样本 如何抽到一个如何抽到一个“好好”样样本本关键:辅助信息(变量)的充分利用关键:辅助信息(变量)的充分利用u 用好的抽样方法u 用好的抽样策略u 用好的估计方法6061抽样方法简介抽样方法简介、简单随机抽样、简单随机抽样(simple random sampling)从总体中随机无放回地,等概率地抽 取样本。特点:特点:各组样本被抽到的可能性相各组样本被抽到的可能性相等等。最简单的抽样方式,抽样理论最完善,是抽样理论的基础。当总体相当大时,由于组织工作与具体技巧上的困难而很少直接采用,但它是其它随机抽样的基础。但实际当中直接采用该方法的并不多。62、分层抽样、分层抽样(stratifiedsampling)(STR)按一定原则,将总体分成若干明显不同的群体(子总体),每个子总体称为层,不同层之间是相互独立的,在每个层内进行抽样,将这些来自“子总体”的样本全部汇总起来成为总体的样本。抽样方法简介(抽样方法简介(2)特点:特点:各层之间有明显不同,注意到明显不同特性的群体在样本中的反映优点:优点:组织实施方便;样本散布均 匀;精度较高;数据处理简单。分层技术是应用上最为普遍的抽样技术之一。63多阶抽样多阶抽样(multi-stagesampling)若总体中N个初级单元各由若干个次级单元组成,先按某种程序抽取n个初级单元,然后对每个被抽中的初级单元再按设计好的程序抽取若干个次级单元,这种抽样方法称为二阶抽样,那两次抽样程序分别称作第一阶和第二阶抽样。特点特点:同一级的各单元地位平等。优点:优点:便于抽样的组织工作;只需对初级单元全部编制抽样框,而对次级单元,只需在初级单元被抽中的情况才编制抽样框;实行了再抽样,提高效率。应用中相当方便。抽样方法简介(抽样方法简介(3)64抽样方法简介(抽样方法简介(4)、整群抽样、整群抽样(clustersampling)先将总体的各个单元归并成数量较少而规模较大的单元,称此单元为群,抽样仅对群抽,对抽中的群进行普查,未抽中的群不作调查。特点:特点:将最后一步相对集中的最基本单元全部调查,在操作上方便、省时、省力。65抽样方法简介(抽样方法简介(5)5.系统抽样系统抽样(systematicsampling)设总体中单元按一定顺序编号,先抽取一个或一组随机数字作为起始单元,然后按一个确定的规律抽取其它单元。特点:特点:一旦起始单元确定,那么全部样本实际上全部确定。一、复习基本概念并说明概念之间的联系1、总体、样本与个体2、个体、抽样单元与抽样框3、均方误差、方差与偏倚4、绝对误差限、相对误差限与置信区间5、估计量、估计值6、抽样分布的理解二、某超市对在3500名顾客抽取120个样本,得到顾客对该超市的满意程度是57%,该调查是在置信水平为0.025,误差限为0.5。试表述调查结果。66展开阅读全文
咨信网温馨提示:1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。




抽样调查-第一章.ppt



实名认证













自信AI助手
















微信客服
客服QQ
发送邮件
意见反馈



链接地址:https://www.zixin.com.cn/doc/2342072.html