分享
分销 收藏 举报 申诉 / 5
播放页_导航下方通栏广告

类型第十二章概率与统计复习纲要.doc

  • 上传人:精****
  • 文档编号:2555639
  • 上传时间:2024-05-31
  • 格式:DOC
  • 页数:5
  • 大小:222.04KB
  • 下载积分:6 金币
  • 播放页_非在线预览资源立即下载上方广告
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    第十二 概率 统计 复习 纲要
    资源描述:
    第十二章 概率与统计复习纲要 一.随机变量 1.定义 (1)随机变量: 1〉.定义:若随机试验的结果可以用一个变量来表示,那么,这样的变量叫随机变量. 2〉。注意: ①随机变量用希腊小写字母ξ,η表示. ②随机变量将随机事件的结果数量化. (2)离散型随机变量:对于随机变量可能取的值,可以按照一定次序一一列出,这样的随机变量叫离散型随机变量. (3*)连续性随机变量:随机变量可以取某一区间内的一切值,这样的随机变量叫连续性随机变量. (4)若ξ是随机变量,则η=aξ+b (a,b是常数,a≠0)也是随机变量. 2.离散型随机变量的分布列: (1)离散型随机变量的分布列的定义: 设离散型随机变量ξ的可能取值为: x1,x2,…,xi,…,xn.ξ取每个值的概率为:.则称表 ξ x1 x2 … xi … xn p P1 P2 … Pi … Pn 为随机变量ξ的概率分布,简称ξ的分布列. (2)两个基本性质: ①Pi≥0(i=1,2,…,n) ②P1+P2+…+Pn=1. (3)求分布列的方法和步骤: ①首先确定随机变量ξ的可能取值有哪些. ②求出每种取值下的随机变量的概率. ③列表对应,即分布列. (4)结论:一般地,离散型随机变量在某一范围内取值的概率等于它在这个范围内各个取值的概率之和. 3.离散型随机变量常见的几种分布: (1)两点分布:分布列: ξ 1 0 p p 1-p 其中0<p<1. (2)二项分布: 1〉.定义:在n次独立重复试验中,设事件A发生的次数为ξ,在每次试验中事件A发生的概率为p,那么,在n次独立重复试验中,事件A恰好发生k次的概率为: 称这样的随机变量ξ服从二项分布.记作: ξ-B(n,p).(其中n,p为参数). 2〉。分布列:P7. (3)几何分布: 1〉。定义:在独立重复试验中某事件A在一次试验中发生的概率为p,则事件A第一次发生时所做的实验次数ξ,也是取值为正整数的随机变量,则事件A恰好在k次试验中第一次发生的概率为: 称这样的随机变量ξ服从几何分布.记作: 2>.分布列:P8. 4。离散型随机变量的期望与方差 (1)离散型随机变量的期望: 1〉.定义:若离散型随机变量ξ的概率分布为: .则称 为ξ的数学期望或平均数,简称期望. 2〉。理解:①期望是离散型随机变量的一个特征数,反映了离散型随机变量取值的平均水平. ②期望是算数平均数的推广,是概率意义下的平均. ③Eξ是一个实数.由ξ的分布列唯一确定,即,随机变量ξ是可变的,而Eξ不变. 3〉。性质:E(aξ+b)=aEξ+b. 4〉。求Eξ的步骤:①列出相应的分布列. ②利用公式求出. (2)方差 1>.定义:若离散型随机变量ξ的概率分布为: 则称 为离散型随机变量ξ的均方差,简称方差. Dξ的算术平方根叫离散型随机变量的标准差.记作:δξ,即. 2〉。理解:①Dξ与δξ都反映了随机变量ξ取值偏离均值Eξ的平均程度. ②Dξ与δξ都反映了随机变量ξ取值的稳定与波动,集中与离散的程度,Dξ越小,稳定性越高,波动越小,表示ξ取值比较集中,Eξ的代表性好. ③δξ与ξ具有相同的单位. 3〉。求方差的方法: ①定义: ②公式: 4〉。性质:D(aξ+b)=a2Dξ. 5>。特殊分布的Eξ和Dξ ①两点分布: ②二项分布: ③几何分布: 二.统计 (一).抽样方法 1.基本概念 ①总体:所要考察的对象的全体. ②个体:总体中的每一个考察对象. ③样本:从总体中抽取的一部分个体.叫总体的一个样本. ④样本容量:样本中个体的数目. ⑤抽样:从总体中抽取一部分个体作为样本的过程. 2.抽样的分类: 说明:着重研究不放回抽样. 3.简单随机抽样 (1).定义:P19。 (2)。特点:①总体个数N是有限的. ②样本容量n小于或总体的个数N,即n≤N. ③样本是从总体中逐个抽取的. ④简单随机抽样是一种不放回抽样. ⑤每个个体入样的可能性(概率)均为. (3)简单随机抽样的实施方法(主要有两种). 抽签法(抓阄法),随机数表法,计算机模拟法,使用统计软件直接抽取. 1〉. 抽签法 ①。定义:P20. ②.适用范围:总体的个体不多时. ③.步骤:ⅰ〉。把总体中的N个个体编号. ⅱ〉。把号码写在号签上,将号签放在一个容器中搅拌均匀. ⅲ〉。每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本. ④.优点:简单易行,当总体中个体不多时,搅拌均匀容易. ⑤。缺点:当总体中个体较多时,很难搅拌均匀,使样本代表性差的可能性很大。 2〉.随机数表法 ①。定义:按照一定的规则到随机数表中选取号码的抽样方法. ②. 随机数表:是统计工作者用计算机生成的随机数,并保证表中的每个位置上的数字是等可能出现的. ③。步骤:ⅰ〉. 把总体中的每个个体编号. ⅱ〉.在随机数表中任选一个数(确定此数的行数和列数). ⅲ〉。从选定的数开始按一定的方向(向左,向右,向下,向上)读数,把适当总体编号的每个号码依次取出,直到样本容量的数目为止. 4.系统抽样(机械抽样) (1)定义:P22. (2)适用范围:总体的个体较多时. (3)步骤:P23。 (4)特征:①当总体容量N较大时,采用系统抽样. ②将总体分成均衡的若干部分是指将总体分段,分段的间隔要求相等,因此系统抽样又称等距抽样,这时间隔一般为:. ③预先制定的规则是指:在第一段内采用简单随机抽样确定一个起始编号,在此编号的基础上,加上分段间隔的整数倍,即为抽样编号. ④简单随机抽样和系统抽样过程中,每个个体被抽取的可能性相等. (5)优点:可以利用个体自身的编号,对数量较多的个体操作比较便捷. (6)缺点:当对总体情况不是很了解的情况下,样本的代表性较差. 5.分层抽样(类型抽样) (1)定义:P24. (2)适用范围:总体由差异明显的几部分组成. (3)步骤:①根据已有信息,将总体分成互不相交的层. ②确定抽样比:. ③确定各层应抽取的个体数.第i层应抽取的个体数目.(为第i层所包含的个体数). 注:ⅰ>.各层抽取的数目之和等于样本容量,即之和为n.ⅱ〉.对不能取整的数,求其近似数④在各层中按③确定的数目,采用随机抽样或系统抽样抽取个体. (4)特点:①适用于总体由差异明显的几部分组成. ②更充分地反映了总体的情况. ③等可能抽样,每个个体被抽到的可能性是. 6.三种抽样方法的比较:P24表 (二).总体分布的估计 1.用样本的数字特征估计总体的数字特征 (1)众数:在一组数据中出现次数最多的数据. 注:众数不一定只有一个. (2)中位数:把一组数据按大小依次排列,处在最中间的一个数据(或最中间两个数据的平均数). (3)平均数:1〉.定义::数据的算术平均数. 2〉.公式: (4)方差: 标准差:. 2.用样本的频率分布估计总体分布 (1)频率分布:是指一个样本数据在各个小范围内所占比例的大小. 一般用频率分布直方图反映样本频率分布. (2)频率分布直方图的画法及步骤: 1〉。求极差:数据中最大值与最小值的差. 2〉。决定组据和组数: 组据:每个小组两端点的距离.. 数据在100以内时,常分为5――12组. 3>。将数据分组:若为小数,则 ,取左闭右开区间,最后一组取闭区间. 决定分点:分点比数据多一位小数,且把第1组的起点稍微小一点. 4〉。登记频数,计算频率,列出频率分布表. 频数:各组内数据的个数. 频率: 5>.画出频率分布直方图:纵轴表示:. 直方图中:个小长方形面积=各组频率. 各长方形面积之和=频率之和=1. 各频数之和=样本容量n. (3)数据的数字特征与频率分布直方图: 众数估计:是最高矩形的中点的横坐标. 中位数估计:使小长方形面积相等的点的横坐标. 平均数估计:每个小矩形面积乘以小矩形底边中点的横坐标之和. (4)﹡频率分布折线图:连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图. (5)总体密度曲线:在样本频率分布直方图中,样本容量越大,所分组数越多,各组的频率就越接近于总体在相应各组取值的频率,相应的频率分布折线图会越来越接近于一条光滑曲线,称这条光滑曲线为总体密度曲线. 总体密度曲线具有“中间高,两头低”的特征. (三).正态分布 1.正态分布 (1)正态函数定义:若总体密度曲线具有“中间高,两头低”的特征.这种类型的总体密度曲线就是或近似地以一个特殊函数表示: 其中μ是总体平均数,σ是总体标准差.即 .函数f(x)称为正态函数. (2)正态分布和正态曲线 若总体密度曲线是或近似地是函数 的图像,则它的分布叫正态分布,记作: f(x)的图像称为正态曲线. (3)正态曲线的性质: ①曲线都在x轴的上方,左右两侧与x轴无限接近,但与x轴永不相交. ②曲线是单峰的,它关于x=μ对称. ③曲线在x=μ处达到最大值,并由此向左右延伸时,曲线逐渐降低,呈现“中间高,两头低”的钟形形状. ④曲线与x轴间的面积为1. ⑤μ,σ对图像形状的影响: 当σ一定时,曲线随着μ的变化而沿着x轴平移. 当μ一定时,σ越大,曲线越“矮胖",表示总体的分布越分散;σ越小,曲线越“高瘦”,表示总体的分布越集中. (4)正态分布的总体特征:随机变量是大量微小的独立随机因素共同作用的结果,而每一种因素都不能起到压倒其他因素的作用时,这个随机变量就被认为服从正态分布. 2.标准正态分布 (1)定义:当μ=0,σ=1时正态总体称为标准正态总体,记作:.相应的函数标准正态函数,它的曲线称为标准正态曲线. (2)性质:①关于y轴对称. ②定义域:x∈R.当x=0时,函数值最大③值域:(0,]. (3)标准正态分布表P65. Φ(x0)=p(x<x0) ①表中x0的值Φ(x0)是指总体取值小于x0的概率.即:Φ(x0)=p(x<x0)图中阴影部分的面积. ②若x0<0,则Φ(x0)=1-Φ(-x0). ③在任一区间(x1,x2)的取值的概率: p=Φ(x2)-Φ(x1). (4)正态总体取值小于x0的概率. (5)应用:3σ法则: 1>.小概率事件:正态总体在以外取值的概率只有4.6%,在区间 以外取值的概率只有0.3%,这些概率很小(一般不超过5%),通常称这些事件发生为小概率事件. 小概率事件在一次试验中几乎不可能发生. 2〉.假设试验方法的思想:首先,假设总体是或近似地为正态总体,然后,依照小概率事件几乎不可能在一次试验中发生的原理对试验结果进行分析. (四).线性回归 1.基本概念 (1)相关关系:两个变量之间的关系可能是确定性关系(如函数关系)或非确定性关系.当自变量取值一定时,因变量的取值也确定,则为确定性关系.当自变量的取值,因变量的取值带有一定的随机性,这两种变量之间的关系,称为相关关系. (2)回归分析:①定义:对具有相关关系的两个变量进行统计分析的方法,叫回归分析. ②理解:通俗地讲,回归分析是寻找相关关系中非确定性关系中的某种确定性,就是通过一个变量或一些变量的变化解释另一变量的变化. (3)散点图:将各数据在平面直角坐标系内的对应点画出来,得到表示两个具有相关关系变量的一组数据的图形,叫散点图. (4)﹡正相关:若散点图中的点散布在从左下角到右上角的区域内,称为正相关. 负相关:若散点图中的点散布在从左上角到右下角的区域内,称为负相关. 2.回归直线: 给定n个样本点所求的回归直线方程为.(a,b是待定系数) 则: 3.对回归模型进行统计检验 (1)相关系数:把 叫做变量y与x之间的样本相关系数,简称相关系数.用它来衡量两个变量之间的线性相关程度. r>0,为正相关.r<0为负相关. (2)相关系数的性质: ①∣r∣≤1. ②∣r∣越接近1,相关程度越强;∣r∣越接近0,相关程度越小. (3)相关性检验的步骤:P44。 假设x与y之间不具有线性相关系数. ①查表(P67):查处与显著水平0.05与 自由度n-2相应的相关关系.临界值r0.05。 ②由公式计算r. ③检验结果:若∣r∣≤r0.05,那么可以认为y与x之间的线性相关关系不显著,从而接受统计假设;若∣r∣>r0.05,拒绝统计假设,可以认为y与x之间具有线性相关关系.
    展开阅读全文
    提示  咨信网温馨提示:
    1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
    2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
    3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
    4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
    5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
    6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。

    开通VIP折扣优惠下载文档

    自信AI创作助手
    关于本文
    本文标题:第十二章概率与统计复习纲要.doc
    链接地址:https://www.zixin.com.cn/doc/2555639.html
    页脚通栏广告

    Copyright ©2010-2026   All Rights Reserved  宁波自信网络信息技术有限公司 版权所有   |  客服电话:0574-28810668    微信客服:咨信网客服    投诉电话:18658249818   

    违法和不良信息举报邮箱:help@zixin.com.cn    文档合作和网站合作邮箱:fuwu@zixin.com.cn    意见反馈和侵权处理邮箱:1219186828@qq.com   | 证照中心

    12321jubao.png12321网络举报中心 电话:010-12321  jubao.png中国互联网举报中心 电话:12377   gongan.png浙公网安备33021202000488号  icp.png浙ICP备2021020529号-1 浙B2-20240490   


    关注我们 :微信公众号  抖音  微博  LOFTER               

    自信网络  |  ZixinNetwork