医学统计学-知识梳理.doc
《医学统计学-知识梳理.doc》由会员分享,可在线阅读,更多相关《医学统计学-知识梳理.doc(13页珍藏版)》请在咨信网上搜索。
1、医学统计学-知识梳理均数方差标准差均数标准差/标准误样本估计值 总体 均数2.58标准差:表示集中位置、离散程度 均数2.58标准误:表示平均水平、抽样误差大小P75一、标准差的主要作用是估计正常值的范围实际应用中,估计观察值正常值范围应该用标准差(s),表示为“MeanSD”。此写法综合表达一组观察值的集中和离散特征的变异情况,说明样本平均数对观察值的代表性。s的大或小说明数据取值的分散或集中。s与样本均数合用,主要是在大样本调查研究中,对正态或近似正态分布的总体正常值范围进行估计。如果不是为了正常值范围估计,一般不用。当数据与正态分布相差很大,或者虽为正态分布,但样本容量太小(小于30或1
2、00),也不宜用估计正常值范围。二、标准差还可用来计算变异系数(CV)当两组观察值单位不同,或两均数相差较大时,不能直接用标准差比较其变异程度的大小,须用变异系数系数来做比较。:2.2标准误的正确使用一、标准误用来衡量抽样误差的大小和了解用样本平均数来推论总体平均数的可靠程度。在抽样调查中,往往通过样本平均数来推论总体平均数,样本标准误适用于正态或近似正态分布的数据,是主要描述小样本试验中,样本容量相同的同质的多个样本平均均数间的变异程度的统计量。即如果多次重复同一个试验,它们之间的变异程度用。显然它越小,样本平均数变异越小,越稳定,用样本平均数估计总体均数越可靠。因此,为说明它的稳定性、可靠
3、性或通过几个对几组数据进行比较(这是科研论文中最常见的),应当用描述数据。实际应用中应该写成“平均数标准误”或而英文表示为“MeanSE”的形式。二、标准误还可以进行总体平均数的区间估计与点估计(置信区间)。根据正态分布原理,与合用还可以给出正态总体平均数的可信区间估计即推论总体平均数的可靠区间,例如常用(其中t0.05(n-1)为样本容量是n的t界值)表示总体均值的95%可信区间,意指总体平均数有95%的把握在所给范围内。三、标准误还可用来进行平均数间的显著性检验,从而判断平均数间的差别是否是由抽样误差引起的。例如:某当地小麦良种的千粒重=34克,现在从外地引入一新品种,通过多小区的田间试验
4、得到千粒重的平均数=35.2克,问新引进品种千粒重与当地良种有无显著差异?新引进品种千粒重与当地良种有无显著差异实质是判断与的差别是否是有田间试验是抽样误差引起,所以要进行显著性检验,这里用t测验进行检验,而,由于,故,所以认为新引进品种千粒重与当地良种千粒重的不同是由于田间试验是抽样误差引起,因此他们之间无显著差异。所以在进行平均数间的显著性检验是必须用到。总之,标准差和标准误最常用的统计量,二者都是衡量样本变量(观察值)随机性的指标,只是从不同角度来反映误差,二者在统计推断和误差分析中都有重要的应用。如果没有标准差,人们就无法看出一组观察值间变异程度有多大,这些数字到底有无代表性,如果没有
5、标准误又很难看出我们的样本平均数是否可以代表总体平均数。所以二者都非常重要。定量资料的统计描述:频数分布表:全距,R=最大值-最小值;组距=全距/组数,(组数8-9人一组)频数分布图:直方图集中位置的描述:平均数31.算数均数:总体均数,样本均数。适用定量资料,对称分布,正态或近似正态2.几何均数:G,适用变量值呈倍数关系,偏态尤其对数变换后正态或近似正态3.中 位 数:M,各种分布(不对称,两端无确切值,分布不明确),正态等于算数均数,对数正态等于几何均数。离散程度描述:51. 极差:R,同全距,各种分布,但一般单峰、对称、小样本2. 四分位数间距:P75P25,(不对称,两端无确切值,分布
6、不明确),P25,P50,P75,共三点将全部观察值分为四部分3. 方差:总体2,样本S2(计算时除以自由度n-1)。单峰对称。4. 标准差:总体,样本S。单峰对称,对数变换后正态或近似正态使用几何标准差。5. 变异系数:CV=S/*100%。适用不同计量单位(身高和体重),或均数相差很大正态分布及其应用:N(,2)特征:4横轴上方均数处最高;均数为中线,左右对称;位置参数/总体均数,形态参数/标准差;曲线下面积分布有一定规律,对称,1.64590.00%,1.9695.00%,2.5899.00%。6. 正态分布:N(,)经标准化转换 为标准正态分布/Z分布:Z(0,1)7. 制定医学参考限
7、值时,分双侧()、单侧,单侧又分只有下限(-)、只有上限(+)。定性资料描述:分类/计数资料,性别,疾病感染情况,病情轻重.,相对数进行统计描述。相对数:31. 率:频率(发病率、患病率),0到1之间;速率(肿瘤患者5年生存率),分母乘以时间数(125人追踪2年死亡2人,年死亡率=2/125*2 *100%)0到。2. 构成比:3. 相对比:两个有关联的指标比值(变异系数,相对危险度,比值比.)应用注意:足够的观察单位数; 不能以构成比代替率,事物内部各组分所占比重不能说明某现象发生的频率或强度大小; 分别将分子和分母合计求合计率; 相对数的比较注意可比性,其他的年龄、性别等相同或相近,可分层
8、或标准化再比较; 样本率、样本构成比应做假设检验再比较(是比较其所代表的总体有无差异)。率的标准化:标准化率:p=(pi被标化组死亡率,Ni标准组年龄别人口,N标准组总人口)标准化死亡率比:SMR=被标化组实际死亡数/预期死亡数被标化组实际死亡数=本年龄组死亡率*标准组本年龄组人口(用被标化组年龄别死亡率去预测标准人口中可能死亡人数)总体均数的估计:抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。样本均数的标准差=均数的标准误,其估计值: (进行一次抽样即可估计均数标准误) t分布 (总体均数的区间估计,t检验.)t分布特征:以t=0为左右对称的单峰分布; 曲线形态取决
9、于自由度大小,n越小,越大,样本间差异越大,n,t分布就是标准正态分布(Z分布)。总体均数的估计: 点估计用作为,无法评价可信程度。区间估计:21、单样本:n不论大小,双侧(1-)置信区间 (确切法) n100,t接近Z,双侧(1-)置信区间 (1.645 1.96 2.58)(正态近似法)2、两样本:两均数之差的标准误: n1、n2不论大小,(确切法) n1、n2均较大时,t接近Z,则(正态近似法)两总体均数差值的置信区间:(12) 为 (t与Z根据条件可互换)t检验:Students t检验,从样本均数推总体均数条件:t检验,单样本中,n50,总体正态分布。 t检验,两小样本,总体正态分布
10、,但两样本总体方差不等。公式好复杂,P96 Z检验,两大样本,n均50,单峰、近似正态。1、 单样本t检验:样本所代表的总体均数与已知总体均数0比较 2、 配对t检验:配对的两受试对象分别接受2种不同处理;同一样品用两种方法或仪器检测;同一受试对象两不同部位测定数据。 H0为两总体均数相同,差值的样本均数所代表的总体均数为0,则 (n为对子数)3、 两独立样本/成组t检验:两样本分别正态分布,H0为两总体均数相等,则 n1、n2不论大小, (确切法) n1、n2均50,t接近Z, (正态近似法)4、两样本几何均数t检验:(抗体滴度等)不服从正态,但服从对数正态,公式同成组t检验。 正态性检验:
11、图示法:P-P图法,Q-Q图法 统计检验法:W检验(n50),矩法检验(总体偏度、峰度),D检验 方差齐性检验:两总体方差齐性检验,判断两总体方差是否相等,F检验 (进行假设检验,=0.10,查F界值表) 多样本方差齐性检验:q检验!Levene检验(可两总体),Bartlett检验。用于方差分析。方差分析ANOVA/F检验:总体均数之间差别?多样本均数的比较,通过对数据变异的分析来推断两个/多个样本均数所代表的总体均数是否有差别。应用条件:各样本是相互独立的随机样本,均服从正态;各样本总体方差相等,即方差齐性。 总变异:数据的均方MS总,处理影响+随机误差(个体差异+测量误差) 组间变异:M
12、S组间,处理因素的影响 组内变异:MS组内,随机误差的影响 )1、 完全随机设计资料:成组设计的多个样本,单因素两水平/多水平方差分析。3变异 同质的受试对象 随机分配到各处理组,各组样本含量相等或不等。 SS总=SS组间+SS组内 V总=V组间+V组内 v总=N-1 V组间=k-1 V组内=N-k ) v1组间,v2组内 注意:总体均数不全相同,两两之间比较用另外的方法。2、 随机区组设计资料;配伍组设计,两因素。3变异 受试对象按照性质分成b个区组/配伍组,每个区组随机分配到k个处理组。 MS总=MS处理组+MS区组+MS误差 v总=v处理组+v区组+v误差 =(处理-1)+(区组-1)+
13、误差=N-1 同理:总体均数不全相同,两两之间比较用另外的方法。3、 多个样本均数两两比较,即上面的“注意”、“同理” SNK法,q检验 Dunnett-t检验4、 交叉设计资料,分两阶段和多阶段() 两阶段交叉设计:一、二组患者和A、B处理方法,一患者服药顺序AB,二组患者BA。5、 析因设计资料6、 重复测量资料检验:样本率或构成比推总体率/构成比之间两个及以上的比较1、 独立样本列联表资料 1)22列联表(四格表)成组 连续性校正(Yates校正)3种 (n40,1T5) (n40,或T1) (确切概率法,以上均适用)A实际频数,T理论频数(总有效率乘以各组人数) 2)R行C列 列联表资
14、料 多个样本率/两个或多个构成比 v=(R-1)(C-1)注意:必须绝对数,不能相对数,因x2与频数有关; 理论频数太小:1/5以上格子的理论频数5,或一个格子理论频数1。或计算最小理论频数5,可以计算;(太小解决方法:增大样本含量;确切概率法;与邻近行或列合并;删去)。 有序多分类变量用秩和检验/Ridit检验; 多个样本率(或构成比)拒绝无效假设时,只能说各总体率之间总的来说有差别,不能说明彼此之间有差别或两者之间有差别。2、 配对设计资料 1)配对22列联表 配对设计且结果为“二分类”(独立列联表数据相互独立,配对设计为研究对象先按某种方式配对,再按两种属性统计,结果不是相互独立)。又称
15、McNemar检验,H0成立:B=C连续性校正: b+c40, 2)配对RR列联表 求统计量T服从x2分布,自由度R-13、 拟合优度的4、 先行趋势的5、 四格表的Fisher确切概率法,好复杂P147秩和检验:基于原始数据在整个样本中按大小排列所占的位次计算统计量,总体分布不明,少量离群值小样本。1、 符号秩和检验(Wilcoxon) 单一样本与总体中位数的比较,配对设计计量差值的比较。 1)配对设计两样本 差值是否来自于中位数为0的总体,进而推断两总体中位数有无差别顺序:求差值编秩分别求正、负秩和确定检验统计量T查T界值表 编秩按绝对值由小到大;差值“0”舍去不计,n也减1;差值绝对值等
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学 统计学 知识 梳理
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【快乐****生活】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【快乐****生活】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。