第十四章调查设计与资料分析.doc
《第十四章调查设计与资料分析.doc》由会员分享,可在线阅读,更多相关《第十四章调查设计与资料分析.doc(14页珍藏版)》请在咨信网上搜索。
1、第十四章 调查设计与资料分析一、教学大纲要求(一) 掌握内容1 调查的概念及其特点,调查研究与实验研究的区别。2 调查设计的基本原则与内容(1) 明确调查目的。(2) 确定调查对象和观察单位。(3) 确定调查方法。(4) 确定调查指标和变量. (5) 调查工具和调查表的种类、调查表和问卷的一般结构、调查问题的形式、调查问题设计应注意的问题。(6) 确定样本含量的意义及方法。(7) 对调查员的要求。(8) 有关伦理道德的问题。3 常用的抽样方法 (1) 概率抽样的概念。(2) 常用的概率抽样方法:简单随机抽样、系统抽样、分层抽样、整群抽样.(3)(二) 熟悉内容(1) 非概率抽样的概念,配额抽样
2、、“滚雪球”样本、识别(判断)样本的概念。(2) 标准化率的概念及计算方法。(三) 了解内容病例对照研究和队列研究的概念及数据的处理和分析。二、教学内容精要(一) 调查的概念及其特点调查(survey)是指在没有任何干预措施的条件下客观地观察和记录研究对象的现状及其相关特征。在调查中,欲研究的对象及其相关特征(包括研究因素和非研究因素)是客观存在的,不能采用随机分配的方法来平衡或消除非研究因素对研究结果的影响,这是调查研究区别于实验研究的最重要特征。当然对非研究因素的控制可以在调查分析阶段通过标准化法、分层分析以及多因素统计分析等方法得以实现,而不是在调查阶段。(二) 调查设计的基本原则与内容
3、1 明确调查目的每一项调查,必须有明确的调查目的.调查目的一般可分为调查的总目的和具体目的.调查目的是选定调查指标的依据。2 确定调查对象和观察单位根据调查目的确定调查对象,即明确调查总体的同质范围。在确定的总体范围内,组成调查对象的每个个体即为观察单位.观察单位可以是一个人、一个家庭或一个群体。3 确定调查方法根据研究问题的性质、客观条件和研究目的选择合适的调查方法.按调查的涉及面,一般可分为普查(overall survey)和抽样调查(sampling survey)。普查也称全面调查(complete survey),是对调查范围内的全部观察对象(总体)进行调查,一般用于了解总体在某一
4、特定“时点”的情况。抽样调查是一种非全面调查,是从总体中抽取一定数量的观察单位组成样本,然后根据样本信息来推断总体特征。抽样调查是医学科研中最为常用的方法.调查方法还可按调查的内容发生的时间,分为横断面调查(crosssectional study)和纵向调查(longitudinal study);按资料的来源,可分为现场调查和利用现有资料两种;按调查方式,可分为面对面调查和非面对面调查(信访、电话采访等)两种.4 确定调查指标和变量调查目的是选定调查指标的依据,调查指标是调查目的的具体体现。设计时,应将调查目的转化为具体的调查指标.调查指标可分为客观指标和主观指标,还可分为定性指标和定量指
5、标。一个指标可以是一个或几个变量,也可以是几个指标构成一个变量。指标的设立应注意灵敏性、特异性和客观性,并紧扣研究目的,做到少而精.5 调查工具和调查表 (1)调查工具:调查工具(instruments)可分为两类,一类是“硬”工具,一类是“软”工具。如尺、秤、温度计等是“硬”工具;调查表和问卷等是“软”工具。调查工具必须标准化,要防止系统误差。工具的使用和调查结果的记录也必须标准化。(2)调查表和问卷的一般结构:调查表和问卷(questionnaire) 一般可划分为4个部分,分别为:“说明部分”、“填写说明、“核查项目”、“调查项目”。“说明部分”主要说明调查目的,以取得调查对象的合作;“
6、填写说明”是为了保证所有调查员和调查对象均能对调查项目及填写方法正确理解、统一认识而编写的;“核查项目”这一部分是与调查目的无关、不向调查对象询问的质量控制项目,如调查员姓名、调查日期、复核结果、未调查原因等;“调查项目部分是调查对象填写的部分,是调查的核心内容.(3)问题的形式:根据问题答案的形式,问题可分为开放型和封闭型两类。开放型问题对问题答案不加任何限制,由调查对象对问题自由回答,适于调查者不清楚答案如何以及答案很多的情况,或事先不能确定回答的范围以及预调查;封闭型问题是根据问题可能的答案,提出两个或多个固定答案共调查对象选填,常用“是与否”或多项选择的形式。封闭型问题只能得到分类资料
7、或等级资料,而开放型问题有时可得到数值变量资料。可根据具体情况加以选择。(4)问题设计应注意的问题:尽量避免术语;避免含糊的提问用词;避免双重问题;避免诱导或强制;敏感问题的调查要有专门技巧。6 确定样本含量为什么要确定样本含量或者说其意义有哪些?(1) 可以控制统计量的抽样误差,样本含量越大,标准误越小;(2) 提高估计的精度,增大样本含量是控制可信区间的宽度的有效办法;(3) 增大样本含量是控制统计分析中型错误的概率大小的有效措施;(4) 表示抽样误差的指标(各种标准误)的抽样误差也与样本含量有关(如样本方差的方差)。在现场调查中,最常用的是估计总体均数及估计总体率时要求的样本含量.估计总
8、体均数的样本含量的计算公式: (141)式中为允许误差。为估计的标准差,一般都是从以前的研究资料中获得.在算得之前,自由度不能确定,仍是未知的,解决的办法是先以代替,用迭代法求得。估计总体率的样本含量的计算公式: (142) 式中为允许误差。如果估计的是一个范围,那就应该取其中最靠近50%的值。假定估计的约在10到30之间,则取=0。30;假定估计的约在40到80之间,则取=0。50;如果对一无所知,则取=0。50。 7调查员 调查员应该经过选择和培训,培训分理论培训和实践培训。调查员的工作量要合理,对调查员应有监督机制和质量控制措施。8 伦理道德 伦理道德问题可以来自于某些调查的问题本身,也
9、可以来自于为获得有效而可靠的资料所用的方法。调查时要注意知情同意(informed consent)和隐私的保护。知情同意是指在研究对象暴露于某种危险之中或丧失某种个人权益时,要征得研究对象同意。 (三) 抽样方法1概率抽样所谓概率抽样(probability sampling),就是在抽样中必须使该总体中的每一个个体都有已知的或可计算的和非零的概率被抽样抽中。常用的概率抽样方法包括:简单随机抽样、系统抽样、分层抽样和整群抽样.各种抽样方法的抽样误差一般是:整群抽样简单随机抽样系统抽样分层抽样.在应用大多数的概率抽样方法时,确切的抽样框架非常重要。抽样框架(Sampling frame),简单
10、地说就是一份完整的可以用来抽样的名单。如果没有抽样框架,也就是说目标人群(总体)不明确,那么所得的调查结论很难说适用于什么人群。 (1)简单随机抽样:所谓简单随机抽样(simple random sampling)是在某个总体中以完全随机的方法抽取一部分个体组成样本。一般, 在抽样前,需要先对抽样总体中的全部个体进行编号即确定抽样框架,然后用抽签或随机数字表的方法抽取一部分个体.这种抽样方法简单,计算抽样误差方便。但是,在大规模的调查中,由于对总体中的所有个体进行编号很困难,而且当样本量不大时抽取的个体可能很分散,因此,抽样和现场调查都会相当困难。 简单随机抽样的均数和率的标准误的计算公式如下
11、: (14-3) (14-4) 期中,称为抽样比(sampling fraction),为“有限总体校正数”(finite population correction)。去掉“有限总体校正数”即可用于无限总体抽样误差的计算。 (2)系统抽样:所谓系统抽样(systematic sampling)是指随机地在抽样框架内每间隔若干个个体抽取一个个体的抽样方法.在一般情况下,系统抽样的抽样误差是和简单随机抽样相仿甚至比简单随机抽样的抽样误差更小。系统抽样的抽样误差一般按简单随机抽样方法估计。 (3)分层抽样:所谓分层抽样(stratified sampling)是先按对观察指标影响较大的某种特征,将
12、总体分为若干类别(统计上称之为“层”,strata),再从每一层内随机抽取一定数量的观察单位,合起来组成样本。分层的原则是层间差别越大越好,层内差别越小越好。在样本总含量n确定后,有两种比较常用的方法来分配各层的观察单位数ni . 按比例分配(proportional allocation):按各层观察单位数Ni 占总体观察单位数N比例抽取样本,使各层样本含量ni与样本总含量n之比等于各层观察单位数Ni与总体观察单位数N之比。采用按比例分层随机抽样时,所得均数或比例是自动加权的。样本量分配可按下式计算: 或 (14-5) 最优分配(optimum allocation):即同时按总体各层观察单
13、位数Ni的多少和标准差i 的大小分配,按下面两式分配各层的样本量,使抽样误差最小。 均数的抽样公式: (14-6) 率的抽样公式: (14-7) 分层抽样中,若令,样本均数和率p 及其标准误的计算公式如下: 样本均数: (148) 样本均数的标准误: (149) 样本率: (1410) 样本率的标准误: (1411) (4)整群抽样:所谓整群抽样(cluster sampling)是先将总体按照某种与研究指标无关的特征化分为个群组,每个群包括若干观察单位,然后在随机抽取个群,将抽取的各个群的全部观察单位组成样本。整群抽样的特点是抽样和调查都很方便,可能省时、省力和省钱.缺点是可能抽样误差较大,
14、特别是群间差别较大时。 整群抽样样本均数和率p 及其标准误的计算公式如下: 样本均数: (14-12) 均数的标准误: (14-13) 式中为样本第群内观察值之和,为各的均数,. 样本率: (14-14) 率的标准误: (1415) 式中为样本中各群阳性数之和,为样本各群的平均阳性数.2 非概率抽样 所谓非概率抽样(non-probability sampling),是指各个个体被抽样抽中的概率是未知的和无法计算的。然而,一些非概率抽样方法,尽管不能按常规的理论来计算抽样误差和推断总体,在特定条件下,还是有用的。但在应用中,不能忘了它们的局限性,特别要注意结论的合适性。 (1)配额抽样:所谓配
15、额抽样(quota sampling)是一种的实用的非概率抽样方法。就是要求样本中个体的构成在指定的几个特征方面的(分配额度)比例完全与总体一样,例如,由于全人口中男女各半,所以要求调查对象中也是男女各半,由于该地有苗族居民30%,要求在调查对象中苗族居民占30。配额抽样可以使样本有宏观上的代表性. (2)“滚雪球样本和识别(判断)样本:在有些情况下,缺少目标总体中全部个体的名单,无法构成抽样框架,此时可用另外一些非概率抽样的方法,即“滚雪球”(snowballing)抽样和识别(judgement)抽样的方法.比如调查太极拳爱好者,由于正式参加太极拳运动的人数太少,因此难以获得抽样框架.但是
16、每一位太极拳运动爱好者都会有一些相同兴趣的好友,所以可以通过这种关系滚雪球似地把样本扩大。所谓识别抽样,是指研究者尽可能找到和识别需调查的个体。这两种调查方法,都未能明确规定抽样框架,甚至难以说出要推断的总体是什么,然而,作为一项探索性的调查,仍可能获得有价值的信息。(四) 病例对照研究和队列研究病例对照研究(case control study)是一种“由果推因”的回顾性观察性研究,根据有无研究疾病或其它结局,将研究人群分为病例组(cases)和对照组(controls),追溯过去某些暴露情况,比较两组暴露水平有无差异,从而得出结局与暴露有无关联的推断.队列研究(cohort study)是
17、一种“由因寻果”的纵向前瞻性观察研究。根据观察开始时有无暴露(exposure)史,研究者将没有出现研究疾病或其它结局(outcome)的研究人群分为暴露人群和非暴露人群,并随访观察一定时期,旨在比较两组人群的疾病“发病率有无差异,从而得出暴露与结局有无关联的推断。两者关系可简要见下表:表141 病例对照研究与队列研究的比较比较项目病例对照研究队列研究观察方向“由果推因的回顾性观察研究“由因寻果”的纵向前瞻性观察研究可获得 指标比数比(odds ratio,OR),当发病率很低时,OR被认为与RR很接近;用OR替代RR估计归因危险度百分比(attributable risk proportio
18、n,AR)累积发病率(cumulative incidence,CI);发病密度(incidence density,ID);相对危险度(relative risk,RR);归因危险度(attributable risk,AR); 归因危险度百分比(attributable risk proportion,AR%)优点省时、省人力、省经费,易组织实施;适于结局为罕见事件的病因研究;一次调查可探索疾病的多个可疑病因,常用于初步验证某病因假说或探测某些病因;当发病率很低时,OR与RR相当近似因结局发生在后,故对暴露资料的收集是无偏倚的;可收集已知混杂因素的信息;可直接计算发病率、相对危险度等疾病与
19、病因关联的指标;病因在前结果在后,可证实病因假说;可获得多种结局资料缺点不适于研究人群中暴露比例很低的因素;不能直接计算发病率;有时难以判断暴露与疾病之间的时间先后关系;易发生选择偏倚、回忆偏倚、混杂偏倚耗费时间、人力、经费;当结局为罕见事件时,需样本量大;易产生以下偏倚:研究对象依从性偏倚、信息偏倚、对暴露与结局的评价偏倚(五) 标准化率调查资料在进行对比分析时,要注意组间的可比性.当两组(或多组)资料的内部各小组的率明显不同,而且各小组观察单位的构成比明显不同时,则不能直接比较两组的总率。这时可采用一个“统一的标准将两组(或多组)资料的内部构成比例调整一致后,分别计算出调整后的总率再作比较
20、,这种方法叫做率的标准化(standardization)。率的标准化有以下两种方法:1 直接标准化直接标准化(direct standardization)是以有代表性的、人群数量大的组作为标准人群,用标准人群各小组观察单位数分别乘以被标化人群的各小组的阳性率(如发病率),得到被标化人群的理论阳性数。理论阳性数除以标准人群总人口数,得到被标化人群的标准化阳性率。2 间接标准化间接标准化(indirect standardization)是以标准人群各小组阳性率乘以被标化人群的各小组观察单位数,得到被标化人群的理论阳性人数。被标化人群的实际阳性人数除以理论阳性总人数,得标准化阳性率比值(如标准
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第十四 调查 设计 资料 分析
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【精****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【精****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。