数值变量资料的统计描述.ppt
《数值变量资料的统计描述.ppt》由会员分享,可在线阅读,更多相关《数值变量资料的统计描述.ppt(61页珍藏版)》请在咨信网上搜索。
1、2-数值变量资料的统数值变量资料的统计描述计描述 回顾回顾资料通常被分为三种类型资料通常被分为三种类型:n n定量资料定量资料(measurement data):(measurement data):用定量的方法对观察单位进行测量得到的资料。用定量的方法对观察单位进行测量得到的资料。n n定性资料定性资料(enumeration data):(enumeration data):用定性的方法得到的资料。用定性的方法得到的资料。n n等级资料等级资料(ranked data):(ranked data):不能精确测量不能精确测量,仅能根据相对大小分为几个等级。仅能根据相对大小分为几个等级。20
2、24/5/242024/5/24周五周五2 2第一节 定量资料频数分布 定量资料进行定量资料进行统计描述统计描述需要根据资料的需要根据资料的分布类型分布类型选择合适的选择合适的统计指标统计指标,因此首先,因此首先要通过频数分布表或分布图了解资料的要通过频数分布表或分布图了解资料的分分布特征布特征。一、频数分布表及其制作一、频数分布表及其制作 2024/5/242024/5/24周五周五3 3例例1 某地区某地区2002年年5558岁健康成人的空腹血糖岁健康成人的空腹血糖(mmol/L)测测定值如下,试编制频数表和观察频数分布情况。定值如下,试编制频数表和观察频数分布情况。5.175.175.5
3、65.564.864.864.874.874.744.745.245.245.515.514.464.464.964.964.824.824.904.905.305.305.225.225.585.584.484.484.804.804.64.64.024.025.165.165.365.364.344.344.244.244.644.644.274.274.254.254.444.444.464.464.624.624.874.874.344.344.904.905.255.254.774.774.854.855.075.074.164.164.664.664.704.704.204.203
4、.953.954.094.094.644.644.334.335.215.214.614.614.984.985.245.244.604.604.254.254.784.785.005.003.603.604.114.114.614.614.084.084.784.784.264.264.444.444.384.384.44.44.794.794.764.764.924.924.604.604.784.785.035.034.354.354.184.184.684.684.654.654.574.574.274.274.994.994.214.214.894.894.714.714.724.7
5、24.414.414.384.384.064.064.794.794.964.964.834.834.454.454.514.514.274.274.504.504.314.315.055.055.595.595.085.085.165.163.743.744.364.365.365.364.644.645.095.094.574.574.464.464.564.564.394.395.245.244.614.614.214.214.964.964.344.344.454.454.864.864.504.504.904.904.454.454.494.494.424.424.684.684.5
6、64.565.385.384.344.344.464.464.164.164.984.984.294.294.834.834.274.273.683.683.853.853.863.864.564.564.564.564.554.555.165.165.155.155.165.162024/5/242024/5/24周五周五4 4频数表的编制步骤:(1)求极差求极差(range):又称为全距):又称为全距 R5.593.60=1.99(mol/L)(2)决定组数、组段和组距决定组数、组段和组距:10组左右,组段包含所组左右,组段包含所有数值,组距为极差的十分之一有数值,组距为极差的十分之一,再
7、略加调整再略加调整 1.99/10 =0.199 0.2(mol/L)(3)列出组段列出组段:第一组段的下限必须包含最小值,最:第一组段的下限必须包含最小值,最后一个组段上限必须大于或等于最大值。后一个组段上限必须大于或等于最大值。3.6 3.8 5.2 5.45.6(4)划记计数划记计数:用划记法将所有数据归纳到各组段,:用划记法将所有数据归纳到各组段,得到各组段的频数。得到各组段的频数。2024/5/242024/5/24周五周五5 5表2-1 某地区2002年5558岁健康成人的空腹血糖(mmol/L)测定值的频数分布表血糖血糖(mol/L)(mol/L)组段组段组中值组中值(xi)(x
8、i)频数频数(f)(f)累计频数(累计频数(ff)频率频率(%)(%)累计频率累计频率(%)(%)3.603.603.70 3.70 3 3 3 32.27 2.27 2.27 2.27 3.803.803.90 3.90 3 3 6 6 2.27 2.27 4.55 4.55 4.004.004.10 4.10 8 8 14 14 6.06 6.06 10.61 10.61 4.204.204.30 4.30 23 23 37 37 17.42 17.42 28.03 28.03 4.404.404.50 4.50 24 24 61 61 18.18 18.18 46.21 46.21 4.
9、604.604.70 4.70 25 25 86 86 18.94 18.94 65.15 65.15 4.804.804.90 4.90 20 20 106 106 15.15 15.15 80.30 80.30 5.005.005.10 5.10 12 12 118 118 9.09 9.09 89.39 89.39 5.205.205.30 5.30 10 10 128 128 7.58 7.58 96.97 96.97 5.405.405.605.605.50 5.50 4 4 132 132 3.03 3.03 100.00 100.00 合计合计132132100.00 100.0
10、0 2024/5/242024/5/24周五周五6 6血糖(mol/L)人数图图图图.某地区某地区某地区某地区20022002年年年年55585558岁健康成人的空腹血糖岁健康成人的空腹血糖岁健康成人的空腹血糖岁健康成人的空腹血糖(mmol/L)(mmol/L)测定值的频数分布图测定值的频数分布图测定值的频数分布图测定值的频数分布图 二、频数分布图二、频数分布图2024/5/242024/5/24周五周五7 7三、频数表和频数分布图用途1 1描述频数分布的类型(描述频数分布的类型(描述频数分布的类型(描述频数分布的类型(对称分布、偏态分对称分布、偏态分对称分布、偏态分对称分布、偏态分布)布)布
11、)布)2 2描述频数分布的特征描述频数分布的特征描述频数分布的特征描述频数分布的特征(集中、离散集中、离散集中、离散集中、离散)3 3便于发现一些特大或特小的可疑值便于发现一些特大或特小的可疑值便于发现一些特大或特小的可疑值便于发现一些特大或特小的可疑值4 4便于进一步做统计分析和处理(加权)便于进一步做统计分析和处理(加权)便于进一步做统计分析和处理(加权)便于进一步做统计分析和处理(加权)2024/5/242024/5/24周五周五8 8(1 1 1 1)对称分布)对称分布)对称分布)对称分布 :若各组段的频数以中心位置左右两侧大体对称,若各组段的频数以中心位置左右两侧大体对称,若各组段的
12、频数以中心位置左右两侧大体对称,若各组段的频数以中心位置左右两侧大体对称,就认为该资料是对称分布就认为该资料是对称分布就认为该资料是对称分布就认为该资料是对称分布描述频数分布的类型(对称、偏态)描述频数分布的类型(对称、偏态)2024/5/242024/5/24周五周五9 9(2 2)偏态分布)偏态分布 :n n1)左偏态分布(正偏态分布):峰向)左偏态分布(正偏态分布):峰向左偏,频数向右侧拖尾。左偏,频数向右侧拖尾。n n2)右偏态分布(负偏态分布)右偏态分布(负偏态分布):峰向右峰向右偏,频数向左侧拖尾。偏,频数向左侧拖尾。2024/5/242024/5/24周五周五1010正偏态(左偏
13、态)正偏态(左偏态)负偏态(右偏态)负偏态(右偏态)2024/5/242024/5/24周五周五1111发现一些特大或特小的可疑值2024/5/242024/5/24周五周五1212第二节 集中趋势指标n n统计上使用统计上使用平均数(平均数(averageaverage)这一指标体系来描这一指标体系来描述一组变量值的集中趋势或平均水平。述一组变量值的集中趋势或平均水平。n n常用的平均数有常用的平均数有:算术均数(均数)(算术均数(均数)(meanmean)几何均数(几何均数(geometricmeangeometricmean)中位数中位数(medianmedian)百分位数(百分位数(p
14、ercentilepercentile)2024/5/242024/5/24周五周五1313一、算术均数算术均数:简称均数(算术均数:简称均数(mean)n n定定义义:是是一一组组变变量量值值之之和和除除以以变变量量值值个个数数所所得得的的商商。均均数数适适用用于于资资料料呈呈正正态态分分布布(或近似正态或对称分布)资料(或近似正态或对称分布)资料。n n总体均数总体均数:样本均数样本均数:x2024/5/242024/5/24周五周五14141、计算方法(1 1)直接计算法)直接计算法)直接计算法)直接计算法 公式公式:2024/5/242024/5/24周五周五1515(2)加权法(利用
15、频数表)公式公式:k:频数表的组段数:频数表的组段数 f:频数:频数 :组中值,其中:组中值,其中i=1,2,k。2024/5/242024/5/24周五周五1616二、几何均数(geometricmean)n n定义:用定义:用定义:用定义:用G G表示,是将表示,是将表示,是将表示,是将n n个观察值个观察值个观察值个观察值x x的乘积再开的乘积再开的乘积再开的乘积再开n n次方次方次方次方的方根(或各观察值的方根(或各观察值的方根(或各观察值的方根(或各观察值x x对数值均值的反对数)。对数值均值的反对数)。对数值均值的反对数)。对数值均值的反对数)。其适用条件是:其适用条件是:其适用条
16、件是:其适用条件是:当一组观察值为非对称分布且其差距较大时,用当一组观察值为非对称分布且其差距较大时,用当一组观察值为非对称分布且其差距较大时,用当一组观察值为非对称分布且其差距较大时,用均数表示其平均水平会受少数特大或特小值影响;均数表示其平均水平会受少数特大或特小值影响;均数表示其平均水平会受少数特大或特小值影响;均数表示其平均水平会受少数特大或特小值影响;数值按大小顺序排列后,各观察值呈倍数关系或近数值按大小顺序排列后,各观察值呈倍数关系或近数值按大小顺序排列后,各观察值呈倍数关系或近数值按大小顺序排列后,各观察值呈倍数关系或近似倍数关系。似倍数关系。似倍数关系。似倍数关系。2024/5
17、/242024/5/24周五周五1717几何均数计算公式:几何均数:几何均数:变量对数值的变量对数值的算术均数的反对数。算术均数的反对数。n n计算几何均数的观察值应大于零2024/5/242024/5/24周五周五1818例 有有7份血清的抗体效价分别为份血清的抗体效价分别为1:2,1:4,1:8,1:16,1:32,1:64,1:128,求求平均抗体效价。平均抗体效价。2024/5/242024/5/24周五周五1919(2)加权法(当观察例数多时采用)(当观察例数多时采用)公式:公式:2024/5/242024/5/24周五周五2020例有有60人的血清抗体效价,分别为人的血清抗体效价,
18、分别为:7人人1:5,11人人1:10,22人人1:20,12人人1:40,8人人1:80,求平均抗体效价。,求平均抗体效价。n n50人的血清平均抗体效价为1:20.705。2024/5/242024/5/24周五周五2121计算几何均数应该注意的事项v变变量量值值中中不不能能有有0 0或或负负数数,因因为为0 0和和负负数数不不能能取对数。取对数。v不不能能同同时时有有正正有有负负。若若全全部部是是负负值值,计计算算时时可先把负号去掉,得出结果后,再加上负号。可先把负号去掉,得出结果后,再加上负号。2024/5/242024/5/24周五周五2222三、中位数与百分位数(一)中位数(一)中
19、位数(median)n n定义:用符号定义:用符号定义:用符号定义:用符号MM表示,中位数是把一组观察值,表示,中位数是把一组观察值,表示,中位数是把一组观察值,表示,中位数是把一组观察值,按按按按大小顺序排列大小顺序排列大小顺序排列大小顺序排列,位置居中的数值(位置居中的数值(位置居中的数值(位置居中的数值(n n为奇数)或位置为奇数)或位置为奇数)或位置为奇数)或位置居中的两个数值的均值(居中的两个数值的均值(居中的两个数值的均值(居中的两个数值的均值(n n为偶数)。为偶数)。为偶数)。为偶数)。其适用情况有:其适用情况有:其适用情况有:其适用情况有:当资料呈明显的偏态分布;当资料呈明显
20、的偏态分布;当资料呈明显的偏态分布;当资料呈明显的偏态分布;资料一端或两端无确定数值(如大于或小于某数资料一端或两端无确定数值(如大于或小于某数资料一端或两端无确定数值(如大于或小于某数资料一端或两端无确定数值(如大于或小于某数值);值);值);值);资料的分布情况不清楚。资料的分布情况不清楚。资料的分布情况不清楚。资料的分布情况不清楚。2024/5/242024/5/24周五周五2323计算公式:n为奇数时为奇数时n为偶数时为偶数时 2024/5/242024/5/24周五周五2424例2.57名正常人的血压名正常人的血压(舒张压舒张压)测定值测定值(mmHg)为为:72,75,76,77,
21、81,82,86,求求中位数中位数。n从小到大排列:72,75,76,77,81,82,86n n若又观察了一个人的血压,为87(mmHg),此时(77+81)/2=79(mmHg)2024/5/242024/5/24周五周五2525频数表资料的中位数下限值下限值L上限值上限值Ui;fm中位数中位数M2024/5/242024/5/24周五周五2626例例例例2.12.1频数表中位数的计算频数表中位数的计算频数表中位数的计算频数表中位数的计算血糖血糖(mol/L)(mol/L)组段组段组中值组中值()频数频数(f)(f)累计频数(累计频数(ff)频率频率(%)(%)累计频率累计频率(%)(%)
22、3.603.603.70 3.70 3 3 3 32.27 2.27 2.27 2.27 3.803.803.90 3.90 3 3 6 6 2.27 2.27 4.55 4.55 4.004.004.10 4.10 8 8 14 14 6.06 6.06 10.61 10.61 4.204.204.30 4.30 23 23 37 37 17.42 17.42 28.03 28.03 4.404.404.50 4.50 24 24 61 61 18.18 18.18 46.21 46.21 4.604.604.70 4.70 25 25 86 86 18.94 18.94 65.15 65.
23、15 4.804.804.90 4.90 20 20 106 106 15.15 15.15 80.30 80.30 5.005.005.10 5.10 12 12 118 118 9.09 9.09 89.39 89.39 5.205.205.30 5.30 10 10 128 128 7.58 7.58 96.97 96.97 5.405.405.605.605.50 5.50 4 4 132 132 3.03 3.03 100.00 100.00 合计合计132(fi)132(fi)100.00 100.00 n n4.60+(0.20/25)*132/2-61=4.642024/5/2
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数值 变量 资料 统计 描述
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【精****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【精****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。