第三章统计整理20132修改.pptx
《第三章统计整理20132修改.pptx》由会员分享,可在线阅读,更多相关《第三章统计整理20132修改.pptx(238页珍藏版)》请在咨信网上搜索。
1、第一节 统计整理概述一、概念 原始统计资料综合统计资料二、统计整理的作用统计整理是一项重要的工作,既是统计调查的必然继续,又是统计分析的基础和前提条件,起着承前启后的作用。三、统计整理的步骤(一)对调查资料的审核:1、对原始资料的审核 完整性审核:检查应调查的单位或个体是否有遗漏;所有的调查项目或指标是否填写齐全。准确性审核:逻辑检查:检查数据是否真实反映客观实际情 况,内容是否符合实际。计算检查:检查数据是否有错误,计算是否正 确等。2、对第二手资料的审核:(1)适用性审核弄清楚数据的来源、数据的口径以及有关的背景材料确定这些数据是否符合自己分析研究的需要(2)时效性审核应尽可能使用最新的统
2、计数据(3)确认是否必要做进一步的加工整理(二)统计分组:分类将统计总体按照一定的标准分成若干类(或组),这是分类法在统计中的具体应用。统计分组是统计整理的基础,分组科学与否直接影响到统计整理工作的质量。(三)统计汇总:加总,求合计数在分组的基础上采用适当的汇总组织形式和技术方法,按分组要求对原始资料进行汇总综合,计算各组及总体的单位数和标志总量。统计汇总是统计整理的中心内容(四)编制统计表以简明扼要的表格形式表述统计汇总的结果,反映社会经济现象在数量方面的具体表现和有关联系。统计表成为统计整理的有效表现形式 第二节 统计分组一、统计分组的概念 1、概念:总体 各组统计整理的首要步骤就是对调查
3、得到的原始资料进行分组。统计分组就是根据统计研究的目的和任务,按照选定的变异标志将总体划分为若干部分或组别的一种统计方法。社会产品按其经济用途分为生产资料消费资料工业企业按年产量或投资总额可分为大型、中型、小型企业;居民按居住地区,一般可分为城市农村从总体的角度看,将总体划分为若干性质不同的组成部分,使不同组的单位之间具有明显的差别,是“分”的过程;另一方面,从个体的角度看,把性质相同的总体单位组合起来,使同组内各单位具有相对的同质性,是“合”的过程。2、统计分组的原则:(1)周延性:即一个不漏(又称穷举原则)(2)互斥性:即能重复(又称互斥原则)即:要求保持组内资料同质性和组间资料的差异性二
4、、统计分组的作用(一)区分社会经济现象的类型社会经济现象是极其复杂多样的,客观上存在着各种不同类型,各种不同类型的现象在规模、水平、速度、结构、比例关系等方面的数量表现有所不同或具有差异,利用统计分组就能根据统计研究的目的,将总体区分为各种性质不同的类型,来研究各类现象的数量差异和特征以及相互关系。(二)研究总体的内部结构利用统计分组,计算出各组数值在总体中所占比重,对社会经济现象的内部结构进行研究,可说明现象总体的基本性质和特征。对现象内部结构的变化进行动态研究,还可以反映现象总体发展变化的过程、趋势和规律表3.1 某厂近几年老、中、青职工所占比重表(%)年份老年职工中年职工青年职工 合计2
5、0002001200220032004403830252035363840382526323542100100100100100从表中资料可以看出,该厂通过近几年职工队伍的调整,初步形成了以中、青年职工为主体的年轻化的职工队伍。(三)研究现象之间的依存关系社会经济现象之间都存在着不同程度的相互联系、相互制约的依存关系,例如,施肥量与亩产量,原材料消耗量与产品单位成本,商品销量与价格之间都存在着一定的依存关系。利用统计分组,将性质上相关的分组资料联系起来分析,就可以揭示现象之间的联系和依存关系。表表3.2 3.2 某年某地区部分商品水平流通费用率表某年某地区部分商品水平流通费用率表按商品流转额分
6、组(万元)商店数(个)商品流通费用率(%)100以下10020020040040060060080080010001000以上25801307540181011.210.59.86.55.85.04.8通过表中分组资料分析,可以看出商品流通费用率与商品流转额之间存在负相关的依存关系为:即随着商品流转规模的扩大,其流通费用率相应降低。三、分组标志(分组标准)(一)分组标志的概念:即分组的依据统计分组的关键在于正确选择分组标志,这是统计分组的核心问题。分组标志就是将总体划分为若干部分或组别的标准或根据如工业企业按生产资料所有制形式分组,则所有制形式就作为分组的标准成为分组标志。如果分组标志选择不当
7、,分组结果就难以正确反映总体的特征。(二)分组标志的选择:任何事物都有许多标志,要在许多可供选择的标志中选取能反映总体性质特征的标志作为分组标志,必须遵循以下三个基本原则:1、根据统计研究的目的选择 2、选择具有本质性的重要标志(抓主要矛盾)3、结合现象所处的具体条件四、统计分组的种类(一)按分组标志的性质不同分 1、按品质标志分组 如:学生按性别分组,企业按所有制性质分组等工业部门分类目录、主要商品目录等,以统一全国的分类口径,便于各部门掌握和使用。2、按数量标志分组 按数量标志分组的结果,形成变量数列。如:学生按年龄分组,企业按产值分组等要从各组的量的变化中研究、确定各组的数量特征,其中涉
8、及到变量的类型、变量值多少、变化范围大小等问题,以及如何相应地确定组数、组距和组限等问题,在第三节中详细叙述。(二)按分组标志的多少不同分 1、简单分组:对总体只按一个标志分组。例:对企业这个总体按所有制性质、规模大小分别分组。(1)(2)全民所有制 大型 企业 集体所有制 企业 中型 其他 小型 若干个相互联系的简单分组构成平行分组体系2、复合分组:对同一总体按照两个或两个以上的标志层叠起来进行分组 例:大型 全民所有制企业 中型 小型 大型 企业 集体所有制企业 中型 小型 大型 其他经济类型 中型 小型 在复合分组方法下形成复合分组体系五、统计分组的方法(一)按品质标志分组 1、选择品质
9、标志作为分组标志 2、确定组数并表示出各组(根据品质标志的具体表现)3、把各单位归入相应的组汇总出各组的单位数(次数)有的很简单,如人口按性别分组。有的很复杂(如人口按职业分组),可查相应的专业分类目录。(二)按数量标志分组 1、选择数量标志作为分组标志 2、确定组数、划定各组的界限(较复杂)3、把各单位归入相应的组汇总得出各组的单位数(称 为次数或频数;也可用相对数表示,称为频率)六、分组结果的表示方法 分组后的结果通常用如下形式来表示:这种形式称为分布数列(或次数分布或频率分布)所分得的各组 各组次数(或频率)合 计 总 次 数第三节 分布数列一、分布数列1、概念:在统计分组的基础上,将总
10、体的各单位按组归类整理,形成总体单位在各组间的分布。这种表明总体单位数在各组分配情况的资料称为次数(频率)分布,又称分布数列。2、分布数列的构成:由两部分构成:(1)各组 (2)各组次数(或频率)3、分布数列的种类:根据分组标志的不同可分为:品质分布数列:可用条形图、圆形图等表示 数量分布数列:简称为变量数列(1)品质分布数列按品质标志分组编制的分布数列,简称品质数列。如性别人数(万人)比率(%)男性女性65 35561 22851.6348.37合计126 583100.00(2)数量分布数列:重点二、变量数列(数量分布数列)1、概念按数量标志分组编制的分布数列。如我国第五次人口普查我国大陆
11、人口年龄分布:人口按年龄分组人口数(亿人)比率(%)14岁以下 2.8979 22.89 15 64 8.8793 70.15 65岁以上 0.8811 6.96 合 计 12.6583 100.00变量数列由两部分构成:变量数列由两部分构成:一是由变量值所形成的各个组,用一是由变量值所形成的各个组,用 表示;表示;二是总体单位在各组中出现的次数。二是总体单位在各组中出现的次数。有两种表现形式:有两种表现形式:一是用绝对数表示的次数,又叫频数,用一是用绝对数表示的次数,又叫频数,用 表示;表示;二是用相对数表示的次数,即各组次数占二是用相对数表示的次数,即各组次数占总次数的比重,称为频率或比率
12、,总次数的比重,称为频率或比率,用用 表示。表示。变量数列按变量类型不同,可分为连续型变量离散型变量变量数列按各组表示方式不同可分为单项变量数列组距数列 1、单项变量数列:每组用一个数表示。适合于离散变量 适合于变量值较少的情况 工人按日产量(件)分组 工人数(人)2 5 3 10 4 32、组距数列:适合于连续变量 适合于变量值较多的情况 可采用等距分组,也可采用不等距分组 学生按成绩分组学生数(人)60以下 3 6070 7 7080 20 8090 8 90以上 2 合 计 40三、组距数列中的有关概念(一)组限:表示每组的界限。有:上限():每组的最大值 下限(L):每组的最小值 1、
13、组限的表示方法有:(1)重叠组限:如:10 20 20 30 在统计每组的次数时应遵循“上限不在内”原则 (2)不重叠组限:如:10 20 (只适用于离散变量)21 30 2、组的表示方法:(1)闭口组:上、下限都有 (2)开口组:上、下限有一缺一(二)组距1、概念:每组中最大值与最小值之间的差距2、计算公式:组距(i)=上限 下限3、种类:根据各组组距是否相等,组距数列可分为:(1)等距数列 (2)异距数列:一般用次数密度表示,它是次数与组距之比。4、组距的确定与表示方法:一般用5、10、20、50、100等类似数字表示。5、全距:所有变量值中最大值与最小值之间的差距 全距(R)=最大变量值
14、 最小变量值(三)组中值 概念:每组中点的数值 计算公式:对于开口组,需先假定其所缺的上限或下限(假设开口组的组距与其相邻组的组距相等)。如:各 组 组 中 值 60以下 55 6070 65 7080 75 8090 85 90以上 95(四)组数(K)组数、组距、全距之间存在如下关系:可用经验公式来确定:K=1+3.322lgn四、变量数列的编制1、排序:将原始数据条理化 排序后 :(1)求出全距 R (2)确定变量数列的种类 (等距数列或不等距数列)2、确定组距和组数3、划定各组的界限:确定组限4、汇总得出各组单位数(次数)5、将结果用分布数列的形式表示出来课堂练习:某工厂同工种的50名
15、工人完成生产定额百分数(%)资料如下:83 88 123 110 118 158 121 146 137 120 163 125 136 127 142 118 123 126 138 151 101 86 82 113 142 108 101 105 125 116 132 138 117 103 114 131 108 87 119 127 105 115 126 125 110 107 141 135 117 93 根据上述资料编制变量数列解:1、将原始资料按其数值大小重新排列82 83 86 87 88 93 101 101 103 105105 107 108 108 110 110
16、 113 114 115 116 117 117 118 118 119 120 121 123 123 125 125 125 126 126 127 127 131 132 135 136 137 138 138 141 142 142 146 151 158 163全距R=163-82=812、确定变量数列的形式采用等距数列3、确定组距和组数组数K=1+3.22lg50=1+3.22 1.69=6.44组距I=全距R/组数K=81/6.44=12.57取组距I=104、确定组限(上限不在内)分组分组次数次数比重(比重(%)100以下612100-110816110-1201122120-
17、1301122130-140714140-15048150以上36合计50100第四节 分布数列的表示方法一、表示法:用表格的形式表示学生按成绩分组组中值学生数(人)比率(%)向上累计向下累计工人数比率工人数比率60以下552 5.025.040100.060 7065615.0820.03895.070 80751332.52152.53280.080 90851537.53690.01947.590100954 10.040100.0410.0合计40100.0计算累计次数方法:1、向上累计:由变量值小的组向大的组累计,累计次数表示该组上限以下(比该组上限小)的组的次数的总和,所以又称为较
18、小制累计。2、向下累计:由变量值大的组向小的组累计,累计次数表示该组下限以上(比该组下限大)的组的次数的总和,所以又称为较大制累计。补充例题1有有27个工人看管机器台数如下:个工人看管机器台数如下:5 4 2 4 3 4 3 4 42 4 3 4 3 2 6 4 42 2 3 4 5 3 2 4 3试编制分布数列。试编制分布数列。解:解:【分析分析】“工人看管机器台数工人看管机器台数”是离是离散型变量,变量值变动范围很小,变量值散型变量,变量值变动范围很小,变量值项数也很少,应编制单项变量数列。项数也很少,应编制单项变量数列。编制结果如下:编制结果如下:按看管机器台数分组按看管机器台数分组看管
19、机器台数看管机器台数工人数工人数工人数的比重(%)2345667112122264174合计27100补充例题2某厂工人日产量资料如下:(单位:公斤)某厂工人日产量资料如下:(单位:公斤)162 158 158 163 156 157 160 162 168 160164 152 159 159 168 159 154 157 160 159163 160 158 154 156 156 156 169 163 167试根据上述资料,编制组距式变量数列,试根据上述资料,编制组距式变量数列,并计算出频率。并计算出频率。解:将原始资料按其数值大小重新排列。解:将原始资料按其数值大小重新排列。152
20、 154 154 156 156 156 156 157 157 158 158 158 159 159 159 159 160 160 160 160 162 162 163 163 163 164 167 168 168 169最大数最大数=169,最小数,最小数=152,全距,全距=169-152=17n=30,分为分为6组组工人按日产量分组表工人按日产量分组表工人按日产量分工人按日产量分组(公斤)组(公斤)工人数(人)工人数(人)比率(频率)比率(频率)(%)152-154155-157158-160161-163164-166167-169361151410.0020.0036.60
21、16.703.3013.30合计合计30100.00补充例题补充例题3某企业某企业50个职工的月工资资料如下:个职工的月工资资料如下:113 125 78 115 84 135 97 105 110 130105 85 88 102 101 103 107 118 103 87116 67 106 63 115 85 121 97 117 10794 115 105 145 103 97 120 130 125 127122 88 98 131 112 94 96 115 145 143试根据上述资料,将试根据上述资料,将50个职工的工资编制成等距个职工的工资编制成等距数列,列出累计频数和累计
22、频率。数列,列出累计频数和累计频率。解:将原始资料按其数值大小重新排列。解:将原始资料按其数值大小重新排列。63 67 78 84 85 85 87 88 88 94 94 96 97 97 97 98 101 102 103 103 103 105 105 105 106 107 107 110 112 113 115 115 115 115 116 117 118 120 121 122 125 125 127 130 130131 135 143 145 145按工资额分组按工资额分组按工资额按工资额分组(元)分组(元)工人数工人数向上累计向上累计向下累计向下累计频数频数频率频率%频数频
23、数频率频率%频数频数频率频率%60-7070-8080-9090-100100-110110-120120-130130以上以上216711106742121422201214239162737435046183254748610050484741342313710096948268462614合计50100二、图示法常用图形有:变量数列:次数分布直方图 次数分布折线图 次数分布曲线图 累计次数图品质数列:条形图 饼状图(圆形图)例:某车间例:某车间50名工人日加工零件数分组表名工人日加工零件数分组表按零件数分组按零件数分组频数(人)频数(人)频率(频率(%)110以下以下1101141151
24、19120124125129130134135以上以上358141064610162820128合计合计50100根据上述资料可绘制如下图形A、直方图和折线图105105 110110 115115 120120 125125 130130 135135 140140日加工零件数(个日加工零件数(个日加工零件数(个日加工零件数(个)频频频频频频数数数数数数(人人人人人人)我一眼就看我一眼就看出来了,大出来了,大多数人的日多数人的日加工零件数加工零件数在在120120125125之间之间!直方图下的面直方图下的面积之和等于积之和等于1 1例:时间数列数据绘制折线图0200400600199119
25、92199319941995199619971998城镇居民农村居民收收入入(元)(元)图图3-14 3-14 城乡居民家庭人均收入城乡居民家庭人均收入B、累计次数折线图例:例:乙城市家庭对住房状况评价的频数分布乙城市家庭对住房状况评价的频数分布回答类别回答类别乙城市乙城市户数户数(户户)百分比百分比(%)向上累积向上累积 向下累积向下累积 户数户数(户户)百分比百分比(%)户数户数(户户)百分比百分比(%)非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意24108934530 8.036.031.015.010.0 24132225270300 8.0 44.0 75
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第三 统计 整理 20132 修改
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【胜****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【胜****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。