第三章-统计整理.ppt
《第三章-统计整理.ppt》由会员分享,可在线阅读,更多相关《第三章-统计整理.ppt(67页珍藏版)》请在咨信网上搜索。
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,第三章,统计整理,第一节 统计整理的基本问题,第二节 统计分组,第三节 分布数列,第四节,统计图,第五节 统计表,不同原因引起的寿命损失,统计研究表明,某种原因会使寿命减少。我们可以用三种不同的方式来描述这个现象。,第一种方式是用文字来描述。比如,未婚男性会使寿命减少3500天,女性则减少1600天;吸烟男性会使寿命较少2250天,女性则减少800天;,案例1,第二种方式是用统计表来表示,结果如下,原因,寿命减少的天数,原因,寿命减少的天数,未婚(男性),3500,危险工作,事故,300,惯用左手,3285,交通事故,200,吸烟(男性),2250,饮酒,130,未婚(女性),1600,滥用药物,90,30%超重,1300,一般工作,事故,74,20%超重,900,自然放射性,8,吸烟(女性),800,喝咖啡,6,抽雪茄,300,医疗x-射线,6,第三种方式是用统计图来表示,结果如下,第一节 统计整理的基本问题,一、统计整理的概念,统计整理是对统计调查所搜集到的各种数据进行分类和汇总,使之,条理化、系统化,的过程。,例:某单位30名职工的月工资额为:1060、840、1100、1090、910、1050、1110、1060、1110、2070、990、1190、870、1050、940、2380、970、1030、1280、1060、850、1060、1010、910、1010、960、1050、1070、1210、950,二、统计整理的步骤,1、对调查资料进行预处理,数据审核,(完整性、准确性),2、统计分组,3、统计汇总,4、编制统计图表,姓名,性别,年龄,与被调查者的关系,工作,单位,参加工作年月,职务,级别,张华,男,26,本人,新华厂,1954.7,干部,20,陈玉芳,男,53,针织厂,1957.3,工人,5,张丽英,女,20,长女,待业,1990.4,无,6,张志平,男,18,长子,医学院,1992.1,学生,无,女,56,妻子,无,无,无,对某单位职工家庭基本情况进行调查,其中一户家庭的相关数据如下:,第二节,统计分组,1.,概,念:将总体按照某个标志(或几个标志)划分成为若干个不同性质的组成部分。,一、,统计分组的概念,分组的实质:对总体来说是分,,对个体来说是合。,1、,穷尽原则,:总体中的每一个单位都应有组可归。,2、,互斥原则,:总体中的任何一个单位只能归属于某一组,不能同时或可能归属于几个组。,二、,统计分组的原则,1,.按分组标志的多少分:,简,单分组 按一个标志对总体进行分组,复,合分组 按两个或两个以上标志分组,三、统计分组的种类,高校学生,理科,文科,女,男,专科,本科,女,男,女,男,专科,本科,女,男,高校学生,女生,男生,简单分组,复合分组,品,质分组 反映事物属性差异,2.按标志的性质不同分为:,数,量分组 反映事物数量差异,划分社会经济现象的类型,反映各类型的特点。,(1)类型分组,3,.按分组标志的作用分,:,例,单位:亿元,210871.0,82972.0,103162.0,24737.0,2006,246619.0,96328.0,121381.0,28910.0,2007,183867.9,73432.9,87364.6,23070.4,2005,159878.3,135822.8,合计,64561.3,56004.7,第三产业,73904.3,62436.3,第二产业,21412.7,17381.7,第一产业,2004,2003,类型,分产业我国国内生产总值,说明社会经济现象的内部结构。,(2),结构分组,年份,2003,2004,2005,2006,2007,第一产业,12.8,13.4,12.5,11.7,11.7,第二产业,46.0,46.2,47.5,48.9,49.2,第三产业,41.2,40.4,40.0,39.4,39.1,合计,100.0,100.0,100.0,100.0,100.0,例,我国国内生产总值构成(%),研究经济现象之间的依存关系。,(3),分析分组,耕作深度分组(cm),地块数,平均收获率(斤/亩),10-12,7,400,12-14,10,460,14-16,16,540,16-18,18-20,12,5,620,680,例,某乡某种农作物的耕作深度与收获率的关系,四、统计分组应注意的问题,1、分组标志选择,统计分组的关键是,选择分组标志,2、分组界限的确定,品质分组:,自然形成,数量分组:,反映质的差别,最好是5或10的倍数,第三节 分配数列(分布数列),一 分配数列的概念和种类,在统计分组的基础上把总体所有的单位按组排列,列出各组对应的,单位数,,并按一定得顺序排列,形成总体单位数在,各个组的分布,,称,分布数列,又可称分配数列或次数分布。,1.概念,例,成绩,人数(人),比重(%),60分以下,2,10,60-70,5,25,70-80,8,40,80-90,3,15,90以上,2,10,合计,20,100,组别(变量)次数(频数)频率(比率、比重),分配数列的两个基本要素,次数,组别,2.种类,以分组标志特征不同分为:,品质分配数列,变量分配数列,例,某班学生的性别构成情况,按性别分组,人数,比重(%),男,30,75,女,10,25,合计,40,100,组别 次数 频率,品,质分配数列,变,量分配数列,单,项数列,组,距数列,分类一:开口数列、闭口数列,分类二:等距数列,异距数列,分类三:间断组距数列、连续组距数列,某大学学生年看电影次数情况,按年看电影次数分组,(次),人数,(人),0,200,1,500,2,1500,3,2000,4,300,合计,4500,单项数列,成绩,人数(人),比重(%),50-60,2,10,60-70,5,25,70-80,8,40,80-90,3,15,90-100,2,10,合计,20,100,某班学习成绩分布数列,等距分组数列,连续组距数列,闭口数列,我国人口的年龄分布,按年龄分组(岁),人数(万人),0-14,28 979,15-64,88 793,65及以上,8 811,合计,126 583,异距分组数列,间断组距数列,开口数列,下限,一,个组的最小值,上限,一,个组的最大值,组限,组,距两端的数值。分为上限和下限。,组距,上,限与下限之差,二 组距数列的编制,(一)组距数列的基本概念,全距,所,有数据中的最大值与最小值之差。,二 组距数列的编制,组中值,组,的上限和下限的中间值。,按数列两端组限形式不同分:,开口式组距,:成绩60分以下,90分以上。,闭口式组距,:40-60分,90-100分。,作用,:它可以作为各组变量取值的代表值,但只是一个近似值,组中值的计算,闭口式分组的组中值求法:,开口式分组的组中值求法:,组中值的计算,某班20人的学生成绩分布,100,10,15,40,25,10,比重(%),75,8,70-80,85,3,80-90,-,20,合计,95,2,90分以上,65,5,60-70,55,2,60分以下,组中值,人数(人),成绩,离散型变量:看电影次数0-,2,,,3,-5,连续性变量:成绩60-,70,,,70,-80,“上组限不在内原则”,当出现异常值时设立,开口组,第一组的下限应低于最小值,最后一组的上限应高于最大值,分组时注意,1、将原始数据按由小到大顺序排列,2、计算全距,全距=最大值-最小值,3、确定组距与组数,组距:为便于计算,组距一般取5或10的倍数,组数,:应以能够显示数据的分布特征和规律为目的,(二)组距数列编制的步骤,5、根据分组整理成频数分布表,例:某单位30名职工的月工资额为:1060、840、1100、910、1090、910、1110、1070、990、940、1190、870、1180、970、1030、1060、850、1060、1110、1050、960、1050、1070、1210、1050、950、1060、1280、1110、1010,第一步:将原始数据按大小顺序排列,840、850、870、910、910、940、950、960、970、990、1010、1010、1030、1050、1050、1050、1060、1060、1060、1060、1070、1170、1090、1100、1110、1110、1180、1190、1210、1280,第二步:计算全距,全距=最大值-最小值=1280-840=440,第三步:确定组数或组距,组距=100,组数=440/100=4.4 5组,840、850、870、910、910、940、950、960、970、990、1010、1010、1030、1050、1050、1050、1060、1060、1060、1060、1070、1170、1090、1100、1110、1110、1180、1190、1210、1280,月工资额(元),职工人数(人),比率(%),800-900,3,10.0,900-1000,7,23.3,1000-1100,13,43.3,1100-1200,5,16.7,1200-1300,2,6.7,合计,30,100.0,840、850、870、910、910、940、950、960、970、990、1010、1010、1030、1050、1050、1050、1060、1060、1060、1060、1070、1170、1090、1100、1110、1110、1180、1190、1210、1280,分成5组,每组组距100,第四步:编制频数分布表,某班20名学生的考试成绩资料如下:,60、61、62、63、74、76、77、79、79、80、80、81、84、85、86、89、90、91、97、99、,试编制频数分布表,Exercise:,(1)全距,=99-60=39,(2)确定组距为10,(3)计算组数=3.9/10=3.94组,(4)编制频数分布表,成绩(分),人数(人),比率(%),60-70,4,20,70-80,5,25,80-90,7,35,90-100,4,20,合计,20,100,某班考试成绩频数分布表,第四节 统计图,数,据,的,类,型,品质数据,数值型数据,直方图,折线图,曲线图,条形图,饼图,环形图,一、品质数据的图示,(一)条形图,(,bar Chart,),用宽度相同的条形的高度或长度来表示品质数列的图形,条形图,【例】一家市场调查公司为研究不同品牌饮料的市场占有率,对随机抽取的一家超市进行了调查。调查员在某天对50名顾客购买饮料的品牌进行了记录,如果一个顾客购买某一品牌的饮料,就将这一饮料的品牌名字记录一次。右边就是记录的原始数据。,不同品牌饮料的频数分布表,饮料品牌,频数,频率(%),可口可乐,15,30,旭日升冰茶,11,22,百事可乐,9,18,汇源果汁,6,12,露露,9,18,合计,50,100,当类别在横轴时,也可称为柱形图,当类别放在纵轴时,称为条形图,两组数据进行对比时,可画对比条形图,(二),饼图(圆形图),用角度来表示数值大小的图形,说明各部分所占比例和结构,不同品牌饮料的频数分布表,饮料品牌,频数,频率(%),可口可乐,15,30,旭日升冰茶,11,22,百事可乐,9,18,汇源果汁,6,12,露露,9,18,合计,50,100,饼图,(三)环形图,8%,36%,31%,15%,7%,33%,26%,21%,13%,10%,非常不满意,不满意,一般,满意,非常满意,甲乙两城市家庭对住房状况的评价(内圈为甲),二、数值型数据的图示,Excel,直方图,折线图,曲线图,(一)直方图,用矩形的,高度表示频数,,宽度表示组距,某单位职工月工资额情况,月工资额(元),职工人数(人),比率(%),800-900,3,10.0,900-1000,7,23.3,1000-1100,13,43.3,1100-1200,5,16.7,1200-1300,2,6.7,合计,30,100.0,分组数据的图示,(直方图的绘制),某电脑公司销售量分布的直方图,频,数,(天),800,900,1300,1200,1000,1100,15,12,9,6,3,50,40,30,20,10,频,率,(%),月工资额,直方图与条形图的区别,条形图宽度,(,表示类别,),,固定,无意义,直方图宽度表示各组的组距,有意义,条形图各矩形分开排列,直方图连续排列,,条形图用于品质数据,直方图用于数值型数据,(二)折线图,折线图也称次数分布多边图,是在直方图的基础上,把直方图顶部的中点,(,组中值,),用直线连接起来,再把原来的直方图抹掉,折线图,某电脑公司销售量分布的直方图,频,数,(天),800,900,1300,1200,1000,1100,15,12,9,6,3,50,40,30,20,10,频,率,(%),月工资额,曲线图,曲线图是组数趋向于无限多时折线图的极限描绘,是一种理论曲线。,频,数,(天),800,900,1300,1200,1000,1100,15,12,9,6,3,50,40,30,20,10,频,率,(%),月工资额,频数分布曲线的类型,对称分布,右偏分布,左偏分布,几种常见的频数分布,1、钟型分布曲线,频数分布的类型,U型分布,2、U型分布,如:人口死亡率,频数分布的类型,正J型分布,反J型分布,3、J型分布,供给,需求,分组,总产值(万元),职工人数(人),劳动生产率,(元/人),大型,中型,小型,合计,2005年某月某公司各企业劳动生产率统计表 单位:,总标题,纵,栏,标,题,:,指,标,指标数值,第五节 统计表,一、统计表的结构和内容,横,行,标,题,:,分,类,主词,宾词,从,形式上看:,统计表由总标题、横行标题、纵栏标题、指标数值构成。,从,内容上看:,统计表由主词和宾词两部分构成。,主词,说明总体及其组成部分,宾词,各个统计指标及其数值。,二,统计表的分类,简单表,总体未分组,简单分组表,总体按一个标志进行分组,复合分组表,总体按二个或二个以上标志进行复合分组,按主词的结构分类,某年某公司所属两企业自行车合格品数量表,厂别,合格品数量(辆),甲厂,5000,乙厂,7000,合 计,12000,例,简单分组表,某年某地区工业增加值和职工人数,项目,增加值(万元),职工人数(人),内资企业,大型,9 750,13 800,中型,8 600,45 000,小型,4 200,10 050,外商投资经营企业,大型,7 300,7 500,中型,5 200,10 400,小型,4 400,4 500,例,复合分组表,三,统计表的设计,1.,总,标题:,简练、准确,2.,指,标数值:,位数对齐,无法计算用,“”,表示,3.,计量单位,:必须标注,4、,注释与资料来源,:最好标注,5.通常情况下,统计表的,左右两边不封口,;,6.,表,的上下边线(基线)用,粗实线或双线,;,总原则,:简明、清晰、实用、美观。,项目,单位,1999年,2000年,调查户数,户,40044,42220,平均每户家庭人口,人,3.14,3.13,平均每户就业人口,人,1.77,1.68,平均每户就业面,%,56.43,53.67,平均一就业者负担人数,元,1.77,1.86,平均每人全部年收入,元,5888.77,6316.81,19992000年城镇居民家庭抽样调查资料,资料来源:中国统计年鉴2001,中国统计出版社,2001,第305页,注:本表为城市和县城的城镇居民家庭抽样调查材料。,The end of chapter3,- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第三 统计 整理
咨信网温馨提示:
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【a199****6536】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【a199****6536】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【a199****6536】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【a199****6536】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
关于本文