第一章-医学统计学基本概念与常用统计描述指标.ppt
《第一章-医学统计学基本概念与常用统计描述指标.ppt》由会员分享,可在线阅读,更多相关《第一章-医学统计学基本概念与常用统计描述指标.ppt(77页珍藏版)》请在咨信网上搜索。
1、医学统计学医学统计学(MedicineStatistics)(MedicineStatistics)2023/5/241第一章第一章 医学统计学基本概念与常用统医学统计学基本概念与常用统计描述指标计描述指标l统计学统计学(statistics):(statistics):“The science and art of dealing with The science and art of dealing with variation in data through collection,variation in data through collection,classification an
2、d analysis in such a classification and analysis in such a way as to obtain reliable results.way as to obtain reliable results.”2023/5/242第一节第一节 医学统计学在医学科学中的医学统计学在医学科学中的地位和作用地位和作用l医学统计学医学统计学(Medicine Statistics)(Medicine Statistics)是应用概率论和数理统计的基本原理和方法,结合医学实际是应用概率论和数理统计的基本原理和方法,结合医学实际阐述统计设计的基本原理和步骤,研
3、究资料或信息的收集、阐述统计设计的基本原理和步骤,研究资料或信息的收集、整理与分析的一门学科。整理与分析的一门学科。l是统计学在医学上的应用;是统计学在医学上的应用;l理论基础是概率论和数理统计;理论基础是概率论和数理统计;SPSSSPSSStatistical Package for Social SciencesStatistical Package for Social SciencesStatistical Product and Service SolutionsStatistical Product and Service Solutions SASSASStatistical A
4、nalysis SystemStatistical Analysis Systeml作用;作用;l统计工作的步骤。统计工作的步骤。2023/5/243第二节第二节 统计工作的步骤统计工作的步骤l研究设计(研究设计(research designresearch design)调查设计、实验设计调查设计、实验设计l资料收集(资料收集(data collectiondata collection)l统计分析(统计分析(statistical analysis)statistical analysis)统计描述统计描述(statistical description)(statistical des
5、cription)统计推断统计推断(statistical inference)(statistical inference)2023/5/244例例 某医生发明了一种新的治疗某病的疗法(治疗组),用现在公某医生发明了一种新的治疗某病的疗法(治疗组),用现在公用的疗法作为对照(对照组),经临床试验,对照组与治疗组的疗用的疗法作为对照(对照组),经临床试验,对照组与治疗组的疗效分别为效分别为P P1 1=75%=75%与与P P2 2=95%=95%,问:能认为这两个有效率之间的差别,问:能认为这两个有效率之间的差别有显著性意义吗?有显著性意义吗?假设的假设的3 3批实验结果批实验结果组别组别例
6、数例数有效率(有效率(%)疗效:疗效:有效有效 无效无效 合计合计甲实验甲实验 对照组对照组 治疗组治疗组乙实验乙实验 对照组对照组 治疗组治疗组丙实验丙实验 对照组对照组 治疗组治疗组1515191930303838454557575 51 110102 215153 320202020404040406060606075.075.095.095.075.075.095.095.075.075.095.095.02023/5/245甲实验中,甲实验中,c c2 2=1.765=1.765,P0.05P0.05,两个有效率两个有效率之间的差别之间的差别无显著性意义;无显著性意义;乙实验中,乙实
7、验中,2 2=6.275=6.275,0.01 P 0.050.01 P 0.05,两个有效率两个有效率之之间的差别有显著性意义;间的差别有显著性意义;丙实验中,丙实验中,2 2=9.412=9.412,P 0.01P 0.01,两个有效率两个有效率之间的差之间的差别有极显著性意义。别有极显著性意义。2023/5/246第三节第三节 统计学中的几个统计学中的几个基本概念基本概念2023/5/2471.1.总体与样本总体与样本(population and sample)(population and sample)根据研究目的确定的同质观察单位的全体称为总根据研究目的确定的同质观察单位的全体称
8、为总体。体。从总体中随机抽取、进行研究的一部分个体所组从总体中随机抽取、进行研究的一部分个体所组成的集合,称为样本。成的集合,称为样本。要保证样本的可靠性、代表性。要保证样本的可靠性、代表性。2.2.同质与变异同质与变异(homogeneity and variation)(homogeneity and variation)统计研究的是有变异的事物,统计分析的任务就统计研究的是有变异的事物,统计分析的任务就是在同质分组的基础上,通过对变异所呈现出来是在同质分组的基础上,通过对变异所呈现出来的统计规律性的研究,透过偶然现象,揭示同质的统计规律性的研究,透过偶然现象,揭示同质事物的本质特征和规律
9、。事物的本质特征和规律。2023/5/2483.3.抽样误差抽样误差(sampling error)(sampling error)因抽样产生的样本与样本,样本与总体相应统因抽样产生的样本与样本,样本与总体相应统计指标之间的差异,称为抽样误差。计指标之间的差异,称为抽样误差。抽样误差的大小主要取决于观察单位间变异程抽样误差的大小主要取决于观察单位间变异程度的大小和样本含量的多少。度的大小和样本含量的多少。4.4.参数和统计量参数和统计量(parameter and statistic)(parameter and statistic)总体的指标统称为参数,样本指标称为统计量。总体的指标统称为参
10、数,样本指标称为统计量。2023/5/2495.5.概率概率(probability)(probability)概率是描述随机事件发生的可能性大小的数值,常用概率是描述随机事件发生的可能性大小的数值,常用P P表示。表示。随机事件概率的大小在随机事件概率的大小在0 0与与1 1之间,即之间,即0 0 P P 1 1。习惯上将习惯上将P P 0.050.05,称为小概率事件。,称为小概率事件。6 6统统计计资资料料的的类类型型定定量量资资料料分分类类资资料料如身高(如身高(cmcm)、体重()、体重(kgkg)等。)等。无无序序分分类类有有序序分分类类二二项项分分类类多多项项分分类类(等等级级资
11、资料料)如阳性与阴性、如阳性与阴性、治愈与未愈。治愈与未愈。如血型为如血型为A A、B B、ABAB、O O型。型。如治疗结果为治愈、显效、如治疗结果为治愈、显效、好转、无效四级。好转、无效四级。2023/5/2410第四节第四节 数值变量的描述性统计数值变量的描述性统计l统计图表;统计图表;l统计指标。统计指标。2023/5/2411一、一、频数分布频数分布(frequency distribution)(frequency distribution)2023/5/2412(一)(一)编制频数表的步骤编制频数表的步骤l求极差求极差R=84-57=27(次(次/分)分)l划分组段划分组段确定组
12、数:较大样本时,一般取确定组数:较大样本时,一般取10组左右。组左右。确定组距:极差确定组距:极差/组数组数=27/10=2.73(次(次/分)分)确定各组段的上下限:上限确定各组段的上下限:上限=下限下限+组距组距l统计各组段内的数据频数,编制频数表统计各组段内的数据频数,编制频数表2023/5/2413表表2.1 1302.1 130名健康成年男子脉搏(次名健康成年男子脉搏(次/分)的频数分布表分)的频数分布表脉搏组段脉搏组段 (1)频数频数(2)频率(频率(%)(3)累计频数累计频数 (4)累计频率(累计频率(%)(5)5659626568717477808385合计合计25121525
13、2619151011301.543.859.2311.5419.2320.0014.6211.547.690.7727193459851041191291301.545.3814.6226.1545.3865.3880.0091.5499.23100.002023/5/2414(二)(二)频数表的用途频数表的用途l可以揭示资料的分布类型和分布特征,以便于可以揭示资料的分布类型和分布特征,以便于选用相应的统计分析方法。选用相应的统计分析方法。l便于进一步计算指标和统计处理。便于进一步计算指标和统计处理。l便于发现某些特大或特小的可疑值。便于发现某些特大或特小的可疑值。2023/5/2415二、二
14、、集中趋势集中趋势(central(central tendency)tendency)的描述的描述l三种平均数三种平均数(average)(average)算术均数算术均数(arithmetic mean)(arithmetic mean)几何均数几何均数(geometric mean)(geometric mean)中位数中位数(median)(median)2023/5/2416(一)算术均数(一)算术均数(arithmetic arithmetic mean,mean,)l简称均数,适合于表达呈正态分布资料的平均简称均数,适合于表达呈正态分布资料的平均水平。水平。l直接法:直接法:l
15、l 例例2-22-2:=81+70+66+81+70+66+69+691313=71.69=71.69(次(次/分)分)2023/5/2417l加权法加权法:例:例:=57.557.5 2+60.52+60.5 5+63.55+63.5 12+12+8+84.54.5 1 1130130=71.62=71.62(次(次/分)分)2023/5/2418(二)几何均数(二)几何均数(geometric mean,Ggeometric mean,G)l适用于原始数据分布不对称,但经对数转换后适用于原始数据分布不对称,但经对数转换后呈对称分布的资料。呈对称分布的资料。2023/5/2419例:例:40
16、40名麻疹易感儿童接种麻疹疫苗后一个月,测其血凝抑名麻疹易感儿童接种麻疹疫苗后一个月,测其血凝抑制抗体滴度,结果如表所示,求几何均数。制抗体滴度,结果如表所示,求几何均数。抗体滴度抗体滴度人数人数 f f滴度倒数滴度倒数 X XlgXlgX1:41:81:161:321:641:1281:2561:512145811641481632641282565120.60210.90311.20411.50511.80612.10722.40822.70932023/5/24202023/5/2421(三)中位数(三)中位数(median,Mmedian,M)l适合于表达偏态资料、或分布不明的资料的平
17、适合于表达偏态资料、或分布不明的资料的平均水平,尤其适合于表达只知数据的个数、但均水平,尤其适合于表达只知数据的个数、但部分较大或较小数据的具体数值未准确知道的部分较大或较小数据的具体数值未准确知道的资料的平均水平。资料的平均水平。2023/5/2422对于原始数据和频数分布表资料,分别用下列两式计算中位数。对于原始数据和频数分布表资料,分别用下列两式计算中位数。M=M=(X X n/2n/2+X+X(n/2+1n/2+1)/2 /2 (n n为偶数)为偶数)X X(n+1n+1)/2/2(n n为奇数)为奇数)其中,其中,L LM M :中位数所在组下限;:中位数所在组下限;i iM M :
18、中位数所在组的组距;:中位数所在组的组距;f fM M :中位数所在组的频数;:中位数所在组的频数;f fL L:中位数所在组前一组的累计频数。:中位数所在组前一组的累计频数。2023/5/2423例例2-4 2-4 表表2.3 1072.3 107正常人的尿铅含量(正常人的尿铅含量(g/Lg/L)的的中位数计算表中位数计算表含量(含量(g/L)(1)频数频数f(2)累计频数累计频数 f (3)累计频率累计频率%(4)0481216202428合计合计1422291815612107143665839810410510713.0833.6460.7577.5791.5997.2098.1310
19、0.00M=8+(107/2-36)=10.41(g/L)4292023/5/2424三、三、离散趋势(离散趋势(tendency of tendency of dispersion)dispersion)的描述的描述l例:设有三组同年龄、同性别儿童体重(例:设有三组同年龄、同性别儿童体重(kgkg)数据如下:数据如下:l甲组甲组 26 28 30 32 3426 28 30 32 34l乙组乙组 24 27 30 33 3624 27 30 33 36l丙组丙组 26 29 30 31 34 26 29 30 31 34 2023/5/2425l描述离散程度的指标:描述离散程度的指标:极差、
20、四分位数间距、方差、标准差及变异极差、四分位数间距、方差、标准差及变异系数。系数。2023/5/2426(一)(一)极差(全距,极差(全距,range,range,R R)l为一组同质观察值中最大值与最小值之差。为一组同质观察值中最大值与最小值之差。l甲组甲组 R=34-26=8R=34-26=8l乙组乙组 R=36-24=12R=36-24=12l甲组数据分布较乙组集中。甲组数据分布较乙组集中。2023/5/2427优点:计算简单优点:计算简单缺点:缺点:1.1.没有充分利用样本信息,只考虑最大值与最小没有充分利用样本信息,只考虑最大值与最小值之差异,不能反映组内其它观察值的变异度。值之差异
21、,不能反映组内其它观察值的变异度。2.2.样本含量越大,抽到较大或较小观察值的可能样本含量越大,抽到较大或较小观察值的可能性越大,则极差可能越大,因此,样本含量悬殊性越大,则极差可能越大,因此,样本含量悬殊时不宜用极差比较分布的离散度。时不宜用极差比较分布的离散度。所以,一般不用极差来反映离散程度。所以,一般不用极差来反映离散程度。2023/5/2428(二)(二)四分位数间距四分位数间距(quartile interval,Qquartile interval,Q)2023/5/24291.1.分位数的概念分位数的概念分位数是一种位置指标,一个特定的分位数将任何一分位数是一种位置指标,一个特
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第一章 医学 统计学 基本概念 常用 统计 描述 指标
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【w****g】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【w****g】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。