分类资料描述x2检验.pptx
《分类资料描述x2检验.pptx》由会员分享,可在线阅读,更多相关《分类资料描述x2检验.pptx(92页珍藏版)》请在咨信网上搜索。
1、1主要内容主要内容第一节第一节 分类变量资料的分类变量资料的统计描述统计描述(复习复习)第二节第二节 分类变量资料的分类变量资料的统计推断统计推断(复习复习)第三节第三节 卡方检验卡方检验(Chi-square test)2第一节第一节 分类变量资料的分类变量资料的统计描述统计描述1.常用相对数常用相对数2.应用相对数时的注意事项应用相对数时的注意事项3什么是分类变量资料?什么是分类变量资料?清点分类资料得数据清点分类资料得数据清点分类资料得数据清点分类资料得数据用什么指标进行描述?用什么指标进行描述?甲、乙两地发生麻疹流行,甲地患儿100人,乙地患儿50人,何地较为严重?若甲地易感儿童667
2、人,而乙地易感儿童250人。甲地麻疹发病率为 100/667100%=15%乙地麻疹发病率为 50/250100%=20%用相对数能较好地反映分类变量资料的特征。用相对数能较好地反映分类变量资料的特征。用相对数能较好地反映分类变量资料的特征。用相对数能较好地反映分类变量资料的特征。41.常用相对数常用相对数相对数相对数:是两个有关联的数值或指标之比。:是两个有关联的数值或指标之比。常用的相对数有:常用的相对数有:率率构成比构成比相对比相对比5(1)率率(rate)率率:是是指指在在一一定定观观察察时时间间内内,某某现现象象实实际际发发生生数数与与可可能能发发生生该该现现象象的的总总数数之之比比
3、,用用以以说说明明某某现现象象发发生生的频率或强度。的频率或强度。K为为比比例例基基数数,如如100%、1000等等。比比例例基基数数的的选选择择主主要要依依习惯而定或使计算结果能保留习惯而定或使计算结果能保留12位整数。位整数。6例例 某研究组在某研究组在北方城镇北方城镇调查了调查了1450人,其中人,其中976人经常人经常吸烟(日平均吸烟(日平均1支以上),在支以上),在南方城镇南方城镇调查了调查了1806人人,有有1052人经常吸烟人经常吸烟,试计算南北方城镇试计算南北方城镇25岁以上男性居岁以上男性居民的吸烟率。民的吸烟率。城镇男性吸烟率城镇男性吸烟率:北方北方 976/1450100
4、%=67.31%,南方南方 1052/1806100%=58.25%。南北方合计南北方合计:(67.31%+58.25%)/2=62.78%(976+1052)/(1450+1806)100%=62.28%7(2)构成比构成比(constituent ratio)构构成成比比:是是指指事事物物内内部部某某一一部部分分的的观观察察单单位位数数与与事事物物内内部部各各组组成成部部分分的的观观察察单单位位数数总总和和之之比比,用用以以说说明事物内部各部分所占的比重或分布。明事物内部各部分所占的比重或分布。常用百分数表示,故又称百分比。常用百分数表示,故又称百分比。8各部分构成比之和为各部分构成比之和
5、为100%100%。此消彼长。此消彼长。构成比的两个特点:构成比的两个特点:9例例10-1 2001年年对对某某地地中中小小学学学学生生进进行行HbsAg检检查查,结结果果见见表表10-1,试试计计算算各各级级学学生生HbsAg检检出出率率及及阳阳性者构成比性者构成比 率和构成比不是同一指标,在应用时应注意加以区分。率和构成比不是同一指标,在应用时应注意加以区分。10类类 型型例数例数死亡例数死亡例数病死率病死率(%)构成比构成比(%)肺炎胸膜炎型肺炎胸膜炎型 75 1216.0 42.9中毒败血型中毒败血型 36 7 19.4 25.0中毒休克型中毒休克型 14 964.3 32.1合合 计
6、计1352820.7 100.0三种类型疾病病死率和构成比三种类型疾病病死率和构成比什么类型疾病病死危险大什么类型疾病病死危险大?11(3)相对比相对比相相对对比比:指指两两个个有有关关指指标标之之比比,说说明明两两个个指指标标的的比比例关系。例关系。两个指标可以是绝对数、相对数、平均数,可以是性质相同两个指标可以是绝对数、相对数、平均数,可以是性质相同或性质不同,但两个指标互不包含。或性质不同,但两个指标互不包含。12例例10-2 某某地地2003-2005年年不不同同性性别别新新生生儿儿数数见见表表10-2,试计算该地不同年份新生儿性别比。,试计算该地不同年份新生儿性别比。132.应用相对
7、数的注意事项应用相对数的注意事项1.计算相对数时分母不宜过小计算相对数时分母不宜过小 2.正确区分构成比和率,不能以构成比代替率正确区分构成比和率,不能以构成比代替率 3.正确计算平均率正确计算平均率4.对对率率和和构构成成比比进进行行比比较较时时,应应注注意意资资料料的的可可比比性性(除研究因素外,其余重要因素应相同或相近除研究因素外,其余重要因素应相同或相近)样本率或构成比进行比较时要作假设检验样本率或构成比进行比较时要作假设检验 14在在进进行行率率或或构构成成比比比比较较时时,除除了了要要比比较较的的因因素素外外,其其他他影影响响的因素应基本一致的因素应基本一致。例例如如,分分析析比比
8、较较两两医医院院病病死死率率的的时时,应应注注意意两两个个医医院院的的条条件件应应基基本本相相同同,如如果果上上级级医医院院的的病病死死率率高高于于基基层层医医院院的的病病死死率率,并并不不能能说说明明上上级级医医院院医医疗疗水水平平不不如如基基层层医医院院,这这是是因因为为许许多多疑难病人均由基层医院转入上级医院所致。疑难病人均由基层医院转入上级医院所致。当当比比较较两两个个总总率率时时,若若其其内内部部构构成成不不同同,需需要要进进行率的标准化。行率的标准化。15第二节第二节 分类变量资料的统计推断分类变量资料的统计推断1.率的抽样分布率的抽样分布2.率的抽样误差与标准误率的抽样误差与标准
9、误3.总体率的区间估计总体率的区间估计4.率比较的率比较的u检验检验161.率的抽样分布率的抽样分布二项分布(二项分布(binomial distribution)的概念)的概念 例例:假假设设注注射射某某种种免免疫疫疫疫苗苗会会有有10%的的人人出出现现不不适适反反应应。问问3人人接接种种后后各各种种可可能能后后果果的的概率是多少?概率是多少?1718贝努利试验贝努利试验(Bernoulli trials):n次次独立独立、重复重复试验(每次试验只出现试验(每次试验只出现A和和 之一,每次概率都是之一,每次概率都是 和和 )。)。贝努利试验中,事件贝努利试验中,事件A可能发生可能发生0,1,
10、2,n次,次,A 恰好发生恰好发生k次的概率为次的概率为19二项分布二项分布(binomial distribution):若随机变量若随机变量X只能在只能在 中取值,各种可能值的概率满足前式,我们中取值,各种可能值的概率满足前式,我们就说就说X服从参数为服从参数为n和和的二项分布的二项分布,记为记为20已知:已知:=0.5,n=10;=0.3,n=5;=0.3,n=10;=0.3,n=15。试试根根据据式式(10-6)求求各各阳阳性性数数事事件件的的概概率率并并作概率分布图。作概率分布图。21图图10-1 率的抽样分布图率的抽样分布图(二项分布)率的抽样分布特征率的抽样分布特征:1.为离散型
11、分布;为离散型分布;2.当当=1-时,呈对称分布;时,呈对称分布;3.当当n 增大时,逐渐逼近正态分布。增大时,逐渐逼近正态分布。一般认为,当一般认为,当n和和n(1-)5时时,可近似看作正态分布。可近似看作正态分布。222.率的抽样误差和标准误率的抽样误差和标准误由由于于抽抽样样所所引引起起的的样样本本率率和和总总体体率率或或各各样样本本率率之之间间存存在在着着差差异异,这这种种差差异异称称为为率率的的抽抽样样误误差差。用用率的标准误率的标准误表示。表示。233.总体率的区间估计总体率的区间估计总体率的估计:总体率的估计:点估计点估计区间估计区间估计正态近似法正态近似法查表法查表法24正态近
12、似法正态近似法当当样样本本含含量量n足足够够大大,样样本本率率p或或1-p均均不不太太小小时时(如如np和和n(1-p)均大于均大于5),样本率的分布近似正态分布。),样本率的分布近似正态分布。u是是标标准准正正态态分分布布双双侧侧临临界界值值,在在估估计计总总体体率率的的95%置置信信区区间间时时,其其值值为为1.96;99%置置信信区区间间时时,其其值值为为2.58。2595%的置信区间:的置信区间:38.47%1.96 1.16%=36.20%40.74%99%的置信区间:的置信区间:38.47%2.58 1.16%=35.48%41.46%例例如如某某地地人人群群中中结结核核菌菌素素试
13、试验验阳阳性性率率95%和和99%的的置信区间为:置信区间为:26查表法查表法当当n较较小小,如如n 50,特特别别是是p接接近近于于0或或1时时,按按二二项项分布原理估计总体率的可信区间。分布原理估计总体率的可信区间。因因其其计计算算比比较较复复杂杂,统统计计学学家家已已经经编编制制了了总总体体率率可可信信区区间间估估计计用用表表,可可根根据据样样本本含含量量n和和阳阳性性数数x查查阅阅统统计计学专著中的附表学专著中的附表。274.两样本率比较的两样本率比较的u 检验检验 当当样样本本含含量量n足足够够大大,样样本本率率p或或1-p均均不不太太小小时时(如如np和和n(1-p)均均大大于于5
14、),样样本本率率的的分分布布近近似似正正态态分分布布。样样本本率率和和总总体体率率之之间间、两个样本率之间的比较可用两个样本率之间的比较可用u检验检验(u test)。表表5-1 两种疗法的心血管病病死率比较两种疗法的心血管病病死率比较疗疗法法死亡死亡生存生存 合合计计病死率病死率(%)盐盐酸苯乙双胍酸苯乙双胍26(X1)178 204(n1)12.75(p1)安慰安慰剂剂 2(X2)62 64(n2)3.13(p2)合合 计计 28240 268 10.45(pc)u 检验的条件:检验的条件:n1p1 和和n1(1-p1)与与n2p2 和和n2(1-p2)均均 529样本率与总体率的比较样本
15、率与总体率的比较 30两个样本率的比较两个样本率的比较 31小小小小 结结结结 1 1样本率也有抽样误差,率的抽样误差的大小用样本率也有抽样误差,率的抽样误差的大小用样本率也有抽样误差,率的抽样误差的大小用样本率也有抽样误差,率的抽样误差的大小用pp或或或或spsp来衡量。来衡量。来衡量。来衡量。pp越大,率的抽样误差越大。越大,率的抽样误差越大。越大,率的抽样误差越大。越大,率的抽样误差越大。2 2率的分布服从二项分布。当率的分布服从二项分布。当率的分布服从二项分布。当率的分布服从二项分布。当n n足够大,足够大,足够大,足够大,和和和和1-1-均均均均不太小,有不太小,有不太小,有不太小,
16、有nn55和和和和n n(1-1-)5 5时,近似正态分布。时,近似正态分布。时,近似正态分布。时,近似正态分布。32 3 3总总总总体体体体率率率率的的的的置置置置信信信信区区区区间间间间是是是是用用用用样样样样本本本本率率率率估估估估计计计计总总总总体体体体率率率率的的的的可可可可能能能能范范范范围围围围。当当当当p p分分分分布布布布近近近近似似似似正正正正态态态态分分分分布布布布时时时时,可可可可用用用用正正正正态态态态近近近近似法估计率的置信区间。似法估计率的置信区间。似法估计率的置信区间。似法估计率的置信区间。4 4根根根根据据据据正正正正态态态态近近近近似似似似原原原原理理理理,
17、可可可可进进进进行行行行样样样样本本本本率率率率与与与与总总总总体体体体率率率率以及两样本率比较的以及两样本率比较的以及两样本率比较的以及两样本率比较的u u检验。检验。检验。检验。率的率的u u 检验能解决以下能解决以下问题吗?率的反应为生与死、阳性与阴性、发生与不率的反应为生与死、阳性与阴性、发生与不发生等二分类变量,如果二分类变量为非正反关发生等二分类变量,如果二分类变量为非正反关系(如治疗系(如治疗A A、治疗、治疗B B);反应为多分类,如何进);反应为多分类,如何进行假设检验?行假设检验?率的率的u u 检验要求:检验要求:n n足够大,且足够大,且nn55和和 n n(1-1-)
18、5 5。如果条件不满足,如何进行假设检验?如果条件不满足,如何进行假设检验?34第三节第三节 2 检验检验(Chi-square test)1.基本思想基本思想2.四格表资料的卡方检验四格表资料的卡方检验3.配对设计分类变量资料的卡方检验配对设计分类变量资料的卡方检验4.行行列表资料的卡方检验列表资料的卡方检验352检验(检验(Chi-square test)t 是是现现代代统统计计学学的的创创始始人人之之一一,英英国国统统计计学学家家K.Pearson于于1900年年提提出出的的一一种种具具有有广广泛泛用用途途的的假假设设检检验验方方法法。常常用用于于分分类类变变量量资资料料的的统统计计推推
19、断断,可可用用于于两两个个或或多多个个率率间间的的比比较较,计计数数资资料的关联度分析料的关联度分析,拟合优度检验拟合优度检验等等。等等。36例例例例10-110-1为为为为比比比比较较较较西西西西药药药药与与与与中中中中药药药药治治治治疗疗疗疗慢慢慢慢性性性性支支支支气气气气管管管管炎炎炎炎的的的的疗疗疗疗效效效效,某某某某医医医医师师师师将将将将符符符符合合合合研研研研究究究究标标标标准准准准的的的的110110例例例例慢慢慢慢性性性性支支支支气气气气管管管管炎炎炎炎患患患患者者者者随随随随机机机机分分分分为为为为两两两两组组组组(两两两两组组组组具具具具有有有有可可可可比比比比性性性性)
20、,西西西西药药药药组组组组8686例例例例,中中中中药药药药组组组组2424例例例例。服服服服药药药药一一一一个个个个疗疗疗疗程程程程后后后后,观观观观察察察察患患患患者者者者的的的的疗疗疗疗效效效效,结结结结果果果果见见见见下下下下表表表表。根根根根据据据据显显显显效效效效率率率率,该该该该医医医医师师师师认认认认为为为为中中中中西西西西药药药药治治治治疗疗疗疗慢慢慢慢性性性性支支支支气气气气管管管管炎炎炎炎的的的的疗疗疗疗效效效效有有有有差差差差别别别别中中中中药组的疗效好于西药组。药组的疗效好于西药组。药组的疗效好于西药组。药组的疗效好于西药组。1 1.2 2检验的基本思想检验的基本思想
21、检验的基本思想检验的基本思想37 表表表表10-1 10-1 中西药治疗慢性支气管炎的显效率中西药治疗慢性支气管炎的显效率中西药治疗慢性支气管炎的显效率中西药治疗慢性支气管炎的显效率【问题问题10-1】(1)该资料为何种类型资料?)该资料为何种类型资料?(2)该研究属于何种设计方案?)该研究属于何种设计方案?(3)该医师作出的结论是否正确?为什么?)该医师作出的结论是否正确?为什么?(4)该资料应该用何种统计方法?其步骤如何?)该资料应该用何种统计方法?其步骤如何?38-22-22表或四格表表或四格表表或四格表表或四格表(fourfold tablefourfold table)表表表表10-
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 分类 资料 描述 x2 检验
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【天****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【天****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。