统计学知识点汇总.doc
《统计学知识点汇总.doc》由会员分享,可在线阅读,更多相关《统计学知识点汇总.doc(3页珍藏版)》请在咨信网上搜索。
统计学知识点汇总 第一章: 统计学是收集、处理、分析、解析数据并从数据中得出结论的科学. 分类:描述统计、推断统计。 描述统计是研究数据收集、处理和描述的统计学方法。 推断统计是研究如何利用样本数据来推断总体特征的统计学方法(内容包括参数估计和假设检验)。 变量:每次观察都会得到不同结果的某种特征。 分类变量:又称无序分类变量,观测结果表现为某种类别的变量。 顺序变量:又称有序分类变量,观测结果表现为某种有序类别的变量。 数值变量:又称定量变量,观测结果表现为数字的变量。 数据:1、分类数据2、顺序数据3、数值型数据 总体:包含所研究的全部个体(数据)的集合。 样本:从总体中抽取的一部分元素的集合. 样本量:构成样本元素的数目。 抽样方法:1、简单随机抽样2、分层抽样3、系统抽样4、整群抽样 简单随机抽样:从含有N个元素的总体中,抽取n个元素组成一个样本,使得总体中的每一个元素都有相同的机会(概率)被抽中。 分层抽样:也称分类抽样,在抽样之前先将总体的元素划分为若干层(类),然后从各个层中抽取一定数量的元素组成一个样本。 软件应用:用Excel抽取简单随机样本。 第二章: 一、定性数据的图示:1、条形图2、帕累托图3、饼图4、环形图 条形图:是用宽度相同的条形来表示数据多少的图形,用于观察不同类别的多少或分布状况。 帕累托图:是按各类别出现的频数多少排序后绘制的条形图。通过对条形的排序,容易看出哪类频数出现的多,哪类出现的少。 饼图:主要用于表示一个样本(或总体)中各类别的频数占全部频数的比例。 用图表展示定量数据: 生成定量数据的频数分布表时,需要先将原始数据按照某种标准分成不同的组别,然后统计出各组别的数据频数即可。 一组数据所分的组数K应不少于5组且不多于15组。 组距=(最大值—最小值)/组数 组数=全距 /组距 每组组距均相等称为等距数列,反之则为异距数列 在比较等距数列与异距数列的次数分布时常用: 次数密度=本组次数/本组组距 2。组中值 class midpoint 组中值=(本组上限+本组下限)/2或组中值=(本组假定上限+本组假定下限)/2 二、定量数据的图示:1、分组数据看分布:直方图2、未分组数据看分布:茎叶图和箱线图、垂线图和误差图 最小值 25%四分位数 中位数 75%四分位数 最大值 箱线图的示意图: 3、两个变量间的关系:散点图是用二维坐标展示两个变量之间关系的一种图形。 4、比较多个样本的相似性:雷达图和轮廓图 雷达图是从一个点出发,用每一条射线代表一个变量,多个变量的数据点连接起来成线,即围成一个区域,多个样本围成多个区域,就是雷达图,利用它也可以研究多个样本之间的相似程度. 5、掌握各种图标的绘制,直方图与条形图的区别、茎叶图与直方图的区别. 三、合理使用图表 Excel应用:生成定性/定量数据的频数分布表(操作步骤)。 第三章:用统计量描述数据 一、水平的度量:平均数:计算形式: =总体标志总量/总体单位总量 (一)简单均数 (二)加权均数 中位数:是一组数据排序后处于中间位置的数值,用Me表示. 众数:是一组数据中频数最大的变量值,直观地反映了数据的集中趋势。是度量定类数据集中趋势的测度。一般用Mo表示. 四分位数:是一组数据排序后处于25%和75%位置上的值。它是通过3个点将全部数据等分为四部分,其中每部分包含25%的数据。显然,中间的四分位数就是中位数,因此通常所说的四分位数是指处在25%位置上和处在75%位置上的数值. 二、差异的度量:1、极差是一组数据的最大值与最小值之差,也称全距,用R表示。由于极差只是利用了一组数据两端的信息,因而容易受极值端的影响,不能全面反映差异状况。 2、四分位差是一组数据75%位置上的四分位数与25%位置上的四分位数之差,也称为内距或四分间距,用Qd表示,反映了中间50%数据的离散程度,其数值越小说明中间的数值越集中,数值越大说明中间的数值越分散,四分位差不受极值的影响。 3、样本方差和标准差: 方差是度量数值变量离散程度的基本测度。n个同性质独立变量和的方差等于各个变量方差之和. n个同性质独立变量平均数的方差等于各变量方差平均数的1/n。 4、标准分数:测度每个数值在该组数据中的相对位置,并可以用它来判断一组数据中是否有离群点,它是某个数据与其平均数的离差除以标准差后的值。 三、比较几组数据的离散程度:离散系数是一组数据的标准差与其相应的平均数之比,它消除了数据水平高低和计量单位对标准差大小的影响。主要用于比较不同样本数据的离散程度,离散系数越大说明数据的离散程度也越大,离散系数越小说明数据的离散程度也越小。 计算公式是: Vs=S/x 四、分布形状的度量 偏态系数 偏态系数为0时,数据是对称分布;偏态系数为负数时,数据是左偏分布,也称为负偏态;偏态系数为正数时,数据是右偏分布,也称为正偏态.偏态系数越大表明偏离程度越大。 峰态系数 峰度系数为3时,数据是对称分布;峰度系数大于3时,数据是尖峰分布;峰度系数小于3时,数据是平峰分布。 软件应用:用Excel计算描述统计量。 第一步:选择【工具】-【数据分析】。在分析工具中选择【描述统计】。单击【确定】。 第二部:将原始数据所在的区域输入【输入区域】;在【输出选项】中选择结果的输出位置;选择【汇总统计】。单击【确定】 第四章:概率分布 事件发生可能性大小的度量就是概率。 随机变量的概率分布1、有些随机变量只能取有限个值,称为离散型随机变量。2、有些则可以取一个或多个区间中的任何值,称为连续性随机变量。 描述随机变量集中程度的统计量称为期望值。 一、离散型随机变量的概率分布(二项分布、超几何分布、泊松分布) 1、二项分布(binomial distribution):互斥现象;独立事件;每次成功概率为p(不成功概率为q).n次试验,成功x次,每次成功的概率p,则成功x次的概率P为 2、超几何分布 (hyper geometric distribution)样本抽取后不放回时的离散型概率分布。N个总体有T次成功次数,则抽取n次中有x次成功的概率。例:6名业务骨干中的3人在职时间超过了5年。随机抽取这6人中的4人,恰好有2人在职时间超过了5年的概率。 3、泊松分布(Poisson distribution) 事件在一段时(空)间内连续发生时指定次数事件的概率。 例:某网店平均每小时接单5个。现在随机抽取1小时观察,恰好接3个定单的概率是 二、连续性随机变量的概率分布(正态分布、指数分布、均匀分布) 正态曲线的性质:1、正态曲线的图形是关于x=μ对称的钟形曲线,且峰值在x=μ处。 2、正态分布的两个参数μ和σ一旦确定,正态分布的具体形式也就唯一确定,均值μ决定正态曲线的具体位置,标准差σ相同而均值不同的正态曲线在坐标轴上体现为水平位移。σ越大,正态曲线越扁平;σ越小,正态曲线越陡峭。 3、当X的取值向横轴左右两个方向无限延伸时,正态曲线的两个尾端也无限渐进横轴,但理论上永远不会与之相交。 4、正态随机变量在特定区间上取值的概率由正态曲线下的面积给出,而且其曲线下的总面积等于1。 三、其他几个重要的统计分布(t分布、χ2分布、F分布) 熟记各种分布的性质与特点. 四、样本统计量的概率分布 1、总体分布为正态分布时大、小样本的样本均值均服从正态分布2、总体分布为非正态分布,大样本时的样本均值服从正态分布,小样本的样本均值服从非正态分布。 五、统计量的标准误差 统计量的标准误差也称为标准误,它是指样本统计量分布的标准差,用于衡量样本统计量的离散程度,在参数估计和假设检验中,它是用于衡量样本统计量与总体参数之间差距的一个重要尺度。 SE=σ/n^1/2 当总体标准差σ未知时,可用样本标准差s代替计算,这时计算的标准误差称为估计标准误差.(统计软件中给出的都是估计标准误差) 样本比例的标准误差可表示为:σp=[π(1-π)/n]^1/2 当总体比例的方差π(1—π)未知时,可用样本比例的方差p(1—p)代替。 注意:区别标准误差与标准差的概念以及反映的内容。 第五章:参数估计 一、参数估计的基本原理 1、点估计 2、区间估计:是在点估计的基础上给出总体参数估计的一个估计区间,该区间通常是由样本统计量加减估计误差。 在区间估计中,由样本估计量构造出的总体参数在一定置信水平下的估计区间称为置信区间,其中区间的最小值称为置信下限,最大值称为置信上限。 一般的,如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例称为置信水平,也称为置信度或置信系数。 置信水平=1-α 3、评价估计量的标准 无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。 有效性:是指估计量的方差尽可能小。 一致性:是指随着样本量的增大,点估计量的值越来越接近被估计总体的参数。 二、一个总体参数的区间估计 类比总体比例/方差的区间估计 三、两个总体参数的区间估计 类比两个总体比例之差/方差比的区间估计 四、样本量的确定 1、估计总体均值时样本量的确定。 2、估计总体比例时样本的确定。(熟练掌握其公式)- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 知识点 汇总
咨信网温馨提示:
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【a199****6536】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【a199****6536】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【a199****6536】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【a199****6536】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
关于本文