生物统计省名师优质课赛课获奖课件市赛课百校联赛优质课一等奖课件.ppt
《生物统计省名师优质课赛课获奖课件市赛课百校联赛优质课一等奖课件.ppt》由会员分享,可在线阅读,更多相关《生物统计省名师优质课赛课获奖课件市赛课百校联赛优质课一等奖课件.ppt(117页珍藏版)》请在咨信网上搜索。
第四章第四章 惯用概率分布惯用概率分布 为了为了 便于读者了解统计分析基本原理,正便于读者了解统计分析基本原理,正确掌握和应用以后各章所介绍统计分析方法,确掌握和应用以后各章所介绍统计分析方法,本章在介绍概率论中最基本两个概念本章在介绍概率论中最基本两个概念事件、事件、概率基础上,重点介绍生物科学研究中惯用几概率基础上,重点介绍生物科学研究中惯用几个随机变量概率分布个随机变量概率分布正态分布、二项分布、正态分布、二项分布、波松分布以及样本平均数抽样分布和波松分布以及样本平均数抽样分布和t分布。分布。下一张下一张 主主 页页 退退 出出 上一张上一张 1/117第一节第一节 事件与概率事件与概率 一、事一、事 件件 (一)必定现象与随机现象(一)必定现象与随机现象 在自然界与生产实践和科学试验中,人在自然界与生产实践和科学试验中,人们会观察到各种各样现象,把它们归纳起来,们会观察到各种各样现象,把它们归纳起来,大致上分为两大类:大致上分为两大类:下一张下一张 主主 页页 退退 出出 上一张上一张 2/117 一类是可预言其结果,即在保持条件不变一类是可预言其结果,即在保持条件不变情况下,重复进行试验,其结果总是确定,必情况下,重复进行试验,其结果总是确定,必定发生(或必定不发生)。这类现象称为定发生(或必定不发生)。这类现象称为必定必定现象现象(inevitable phenomena)或)或确定性确定性现象现象(definite phenomena)。)。另一类是事前不可预言其结果,即在保持另一类是事前不可预言其结果,即在保持条件不变情况下,重复进行试验,其结果未必条件不变情况下,重复进行试验,其结果未必相同。这类在个别试验中其结果展现偶然性、相同。这类在个别试验中其结果展现偶然性、不确定性现象,称为不确定性现象,称为随机现象随机现象(random phenomena)或或 不不 确确 定定 性性 现现 象象(indefinite phenomena)。)。下一张下一张 主主 页页 退退 出出 上一张上一张 3/117 随机现象或不确定性现象,有以下特点:随机现象或不确定性现象,有以下特点:在一定条件实现时,有各种可能结果发生,在一定条件实现时,有各种可能结果发生,事前人们不能预言将出现哪种结果;对一次或事前人们不能预言将出现哪种结果;对一次或少数几次观察或试验而言,其结果展现偶然性、少数几次观察或试验而言,其结果展现偶然性、不确定性;不确定性;但在相同条件下进行大量重复试验时,其但在相同条件下进行大量重复试验时,其试验结果却展现出某种固有特定规律性试验结果却展现出某种固有特定规律性频频率稳定性率稳定性,通常称之为随机现象统计规律性。,通常称之为随机现象统计规律性。下一张下一张 主主 页页 退退 出出 上一张上一张 4/117 (二)随机试验与随机事件(二)随机试验与随机事件 1、随机试验、随机试验 通常我们把依据某一研究目通常我们把依据某一研究目标标,在一定条件下对自然现象所进行观察或试在一定条件下对自然现象所进行观察或试验统称为验统称为试验试验(trial)。)。而一个试验假如满足而一个试验假如满足下述三个特征下述三个特征 ,则则 称称 其其 为为 一个一个 随机试验随机试验(random trial),简称),简称试验试验:下一张 主 页 退 出 上一张 5/117 (1 1)试验能够在相同条件下屡次重复进行;)试验能够在相同条件下屡次重复进行;)试验能够在相同条件下屡次重复进行;)试验能够在相同条件下屡次重复进行;(2 2)每次试验可能结果不止一个)每次试验可能结果不止一个)每次试验可能结果不止一个)每次试验可能结果不止一个 ,而且事先知道,而且事先知道,而且事先知道,而且事先知道会有哪些可能结果;会有哪些可能结果;会有哪些可能结果;会有哪些可能结果;(3 3)每次)每次)每次)每次 试验总是恰好出现这些可能结果中一个试验总是恰好出现这些可能结果中一个试验总是恰好出现这些可能结果中一个试验总是恰好出现这些可能结果中一个 ,但在一次试验之前却不能必定这次试验会出现哪一,但在一次试验之前却不能必定这次试验会出现哪一,但在一次试验之前却不能必定这次试验会出现哪一,但在一次试验之前却不能必定这次试验会出现哪一个结果。个结果。个结果。个结果。比如在一定孵化条件下,孵化比如在一定孵化条件下,孵化比如在一定孵化条件下,孵化比如在一定孵化条件下,孵化6 6枚种蛋,观察其出枚种蛋,观察其出枚种蛋,观察其出枚种蛋,观察其出雏情况雏情况雏情况雏情况 ;又如观察两头临产妊娠母牛所产犊牛性别情又如观察两头临产妊娠母牛所产犊牛性别情又如观察两头临产妊娠母牛所产犊牛性别情又如观察两头临产妊娠母牛所产犊牛性别情况况况况 ,它们都含有随机试验三个特征,所以都是随机试它们都含有随机试验三个特征,所以都是随机试它们都含有随机试验三个特征,所以都是随机试它们都含有随机试验三个特征,所以都是随机试验。验。验。验。下一张下一张 主主 页页 退退 出出 上一张上一张 6/117 2、随机事件、随机事件 随机试验每一个可能结果,在一定条件下可随机试验每一个可能结果,在一定条件下可 能能 发发 生生,也,也 可可 能能 不不 发生,称为发生,称为随机事件随机事件(random event),简称),简称 事事 件件(event),),通惯用通惯用A、B、C等来表示。等来表示。(1)基本事件)基本事件 我我 们们 把把 不不 能能 再再 分事件称为分事件称为基本事件基本事件(elementary event),也也 称称 为为 样本点样本点(sample point)。)。下一张下一张 主主 页页 退退 出出 上一张上一张 7/117 比如,在编号为比如,在编号为比如,在编号为比如,在编号为1 1、2 2、3 3、10 10 十头猪中随十头猪中随十头猪中随十头猪中随机抽取机抽取机抽取机抽取1 1头,有头,有头,有头,有1010种不一样可能结果:种不一样可能结果:种不一样可能结果:种不一样可能结果:“取取取取 得得得得 一一一一 个个个个 编编编编 号号号号 是是是是 1”1”、“取得一个编号取得一个编号取得一个编号取得一个编号是是是是2”2”、“取得一个编号是取得一个编号是取得一个编号是取得一个编号是10”10”,这,这,这,这1010个事件都是个事件都是个事件都是个事件都是不可能再分事件,它们都是基本事件。不可能再分事件,它们都是基本事件。不可能再分事件,它们都是基本事件。不可能再分事件,它们都是基本事件。由若干个基本事件组合而成事件称为由若干个基本事件组合而成事件称为由若干个基本事件组合而成事件称为由若干个基本事件组合而成事件称为 复合事件复合事件复合事件复合事件 (compound eventcompound event)。如)。如)。如)。如 “取得一个编号是取得一个编号是取得一个编号是取得一个编号是 2 2倍数倍数倍数倍数”是一个复合事件,它由是一个复合事件,它由是一个复合事件,它由是一个复合事件,它由 “取得一个编号是取得一个编号是取得一个编号是取得一个编号是2”2”、“是是是是4”4”、“是是是是6 6、“是是是是8”8”、“是是是是10”510”5个基本事件组个基本事件组个基本事件组个基本事件组合而成。合而成。合而成。合而成。下一张下一张 主主 页页 退退 出出 上一张上一张 8/117 (2)必定事件)必定事件 我们把在一定条件下必定会发生事件称为我们把在一定条件下必定会发生事件称为必定事件必定事件(certain event),用),用表示。表示。比如,在严格按妊娠期母猪喂养管理要求比如,在严格按妊娠期母猪喂养管理要求喂养条件下,妊娠正常母猪经喂养条件下,妊娠正常母猪经114天左右产仔,天左右产仔,就是一个必定事件。就是一个必定事件。下一张下一张 主主 页页 退退 出出 上一张上一张 9/117 (3)不可能事件)不可能事件 我们把在一定条件下不可能发生事件称为我们把在一定条件下不可能发生事件称为不可能事件不可能事件(impossible event),用),用表表示。示。比如,在满足一定孵化条件下,从石头孵比如,在满足一定孵化条件下,从石头孵化出雏鸡,就是一个不可能事件。化出雏鸡,就是一个不可能事件。必定事件与不可能事件实际上是确定性现必定事件与不可能事件实际上是确定性现象,即它们不是随机事件,象,即它们不是随机事件,但但 是是 为了方便起为了方便起见,我们把它们看作为两个特殊随机事件。见,我们把它们看作为两个特殊随机事件。下一张下一张 主主 页页 退退 出出 上一张上一张 10/117二二、概概 率率 (一)概率统计定义(一)概率统计定义 研究随机试验,仅知道可能发生哪些随机研究随机试验,仅知道可能发生哪些随机事件是不够,还需了解各种随机事件发生可能事件是不够,还需了解各种随机事件发生可能性大小,以揭示这些事件内在统计规律性,从性大小,以揭示这些事件内在统计规律性,从而指导实践。这就要求有一个能够而指导实践。这就要求有一个能够刻划事件发刻划事件发生可能性大小数量指标生可能性大小数量指标,这指标应该是事件本,这指标应该是事件本身所固有,且不随人主观意志而改变,人们身所固有,且不随人主观意志而改变,人们称称之为概率之为概率(probability)。事件)。事件A概率记为概率记为P(A)。)。下一张下一张 主主 页页 退退 出出 上一张上一张 11/117 概率统计定义概率统计定义 在相同条件下进行在相同条件下进行n次重复次重复试验,假如随机事件试验,假如随机事件A发生次数为发生次数为m,那么,那么m/n称为随机事件称为随机事件A频率频率(frequency);当试验重);当试验重复数复数n逐步增大时,随机事件逐步增大时,随机事件A频率越来越稳定频率越来越稳定地靠近某一数值地靠近某一数值 p,那么那么 就就 把把 p称为随机事称为随机事件件A概率概率。下一张下一张 主主 页页 退退 出出 上一张上一张 12/117 这这 样样 定定 义义 概概 率率 称称 为为 统统 计计 概概 率率(statistics probability),或者称),或者称后验概后验概率率(posterior probability)。)。比如比如 为了确定抛掷一枚硬币发生正面朝上为了确定抛掷一枚硬币发生正面朝上这个事件概率这个事件概率,历史上有些人作过成千上万次,历史上有些人作过成千上万次抛掷硬币试验。在表抛掷硬币试验。在表41中列出了他们试验统中列出了他们试验统计。计。下一张下一张 主主 页页 退退 出出 上一张上一张 13/117 表表41 抛掷一枚硬币发生正面朝上抛掷一枚硬币发生正面朝上 试验统计试验统计 下一张下一张 主主 页页 退退 出出 上一张上一张 14/117 从表从表4-1可看出,伴随试验次数增多,正可看出,伴随试验次数增多,正面朝上这个事件发生频率越来越稳定地靠近面朝上这个事件发生频率越来越稳定地靠近0.5,我们就把,我们就把0.5作为这个事件概率。作为这个事件概率。在普通情况下,随机事件概率在普通情况下,随机事件概率p是不可能准是不可能准确得到。通常以试验次数确得到。通常以试验次数n充分大时随机事件充分大时随机事件A频率作为该随机事件概率近似值。频率作为该随机事件概率近似值。即即 P(A)=pm/n (n充分大)充分大)(4-14-1)下一张下一张 主主 页页 退退 出出 上一张上一张 15/117 (二)概率古典定义(二)概率古典定义 对于一些随机事件,用不着进行屡次重复试对于一些随机事件,用不着进行屡次重复试验来确定其概率验来确定其概率,而是依据随机事件本身特征而是依据随机事件本身特征直接计算其概率。直接计算其概率。有很多随机试验含有以下特征:有很多随机试验含有以下特征:1、试验全部可能结果只有有限个,即样本、试验全部可能结果只有有限个,即样本空间中基本事件只有有限个;空间中基本事件只有有限个;2、各、各 个个 试验可能结果出现可能性相等,试验可能结果出现可能性相等,即全部基本事件发生是等可能;即全部基本事件发生是等可能;3、试验全部可能结果两两互不相容。、试验全部可能结果两两互不相容。下一张下一张 主主 页页 退退 出出 上一张上一张 16/117 含有上述特征随机试验,称为含有上述特征随机试验,称为古典概型古典概型(classical model)。对于古典概型,概率)。对于古典概型,概率定义以下:定义以下:设样本空间由设样本空间由 n 个等可能基本事件所组成,个等可能基本事件所组成,其中事件其中事件A包含有包含有m个基本事件,则事件个基本事件,则事件A概率概率为为m/n,即,即 P(A)=m/n (4-2)下一张下一张 主主 页页 退退 出出 上一张上一张 17/117 这么定义概率称为这么定义概率称为古典概率古典概率(classical probability)或或先验概率先验概率(prior probability)。【例【例4.1】在编号为】在编号为1、2、3、10十头十头猪中随机抽取猪中随机抽取1头,求以下随机事件概率。头,求以下随机事件概率。(1)A=“抽得一个编号抽得一个编号4”;(2)B=“抽得一个编号是抽得一个编号是2倍数倍数”。因为该试验样本空间由因为该试验样本空间由10个等可能基本事个等可能基本事件组成,即件组成,即n=10,而事件而事件A所包含基本事件有所包含基本事件有4个,即抽得编号为个,即抽得编号为1,2,3,4中任何一个,中任何一个,事件事件A便发生,于是便发生,于是mA=4,所以,所以 下一张下一张 主主 页页 退退 出出 上一张上一张 18/117 P(A)=mA/n=4/10=0.4 同理,事件同理,事件B所包含基本事件数所包含基本事件数mB=5,即,即抽得编号为抽得编号为2,4,6,8,10中任何一个,事件中任何一个,事件B便发生,故便发生,故 P(B)=mB/n=5/10=0.5。【例【例4.2】在在N头奶牛中,有头奶牛中,有M头曾有流产头曾有流产史,从这群奶牛中任意抽出史,从这群奶牛中任意抽出n头奶牛,试求头奶牛,试求:(1)其中恰有其中恰有m头有流产史奶牛概率是多少?头有流产史奶牛概率是多少?(2)若若N=30,M=8,n=10,m=2,其概,其概率是多少?率是多少?下一张下一张 主主 页页 退退 出出 上一张上一张 19/117 我们把从有我们把从有M头奶牛曾有流产史头奶牛曾有流产史N头奶牛头奶牛中任意抽出中任意抽出n头奶牛头奶牛,其中恰有,其中恰有m头有流产史头有流产史这一事件这一事件 记为记为A,因为因为 从从 N 头头 奶奶 牛牛 中中 任任 意意 抽抽 出出 n 头头 奶牛奶牛基本事件总数为基本事件总数为 ;事件事件A所包含基本事件数为所包含基本事件数为 ;所以所求事件所以所求事件A概率为:概率为:下一张下一张 主主 页页 退退 出出 上一张上一张 20/117 将将N=30,M=8,n=10,m=2代入代入上式,得上式,得 =0.0695 即在即在30头奶牛中有头奶牛中有8头曾有流产史,从这头曾有流产史,从这群奶牛随机抽出群奶牛随机抽出 10 头奶牛其中有头奶牛其中有2头曾有流产头曾有流产史概率为史概率为6.95%。下一张下一张 主主 页页 退退 出出 上一张上一张 21/117(三)概率性质(三)概率性质 1、对于任何事件、对于任何事件A,有,有0P(A)1;2、必定事件概率为、必定事件概率为1,即,即P()=1;3、不可能事件概率为、不可能事件概率为0,即,即P()=0。22/117 三、小概率事件实际不可能性原理三、小概率事件实际不可能性原理 随机事件概率表示了随机事件在一次试验随机事件概率表示了随机事件在一次试验中出现可能性大小。若随机事件概率很小,比中出现可能性大小。若随机事件概率很小,比如小于如小于0.05、0.01、0.001,称之为,称之为小概率小概率事件。事件。下一张下一张 主主 页页 退退 出出 上一张上一张 23/117 小概率事件即使不是不可能事件,但在一小概率事件即使不是不可能事件,但在一次试验中出现可能性很小,不出现可能性很次试验中出现可能性很小,不出现可能性很 大大,以,以 至于实际上能够看成是不可能发生。在统至于实际上能够看成是不可能发生。在统计学上,计学上,把小概率事件在一次试验中看成是实把小概率事件在一次试验中看成是实际不可能发生事件称为小概率事件实际不可能际不可能发生事件称为小概率事件实际不可能性原理,亦称为小概率原理性原理,亦称为小概率原理。小概率事件实际。小概率事件实际不可能性原理是统计学上进行假设检验(显著不可能性原理是统计学上进行假设检验(显著性检验)基本依据。性检验)基本依据。下一张下一张 主主 页页 退退 出出 上一张上一张 24/117第二节第二节 概率分布概率分布 事件概率表示了一次试验某一个结果发事件概率表示了一次试验某一个结果发生可能性大小。若要全方面了解试验,则必生可能性大小。若要全方面了解试验,则必须知道试验全部可能结果及各种可能结果发须知道试验全部可能结果及各种可能结果发生概率,即必须知道随机试验概率分布生概率,即必须知道随机试验概率分布(probability distribution)。为了深入研。为了深入研究随机试验究随机试验,我,我 们们 先引入随机变量先引入随机变量(random variable)概念。概念。下一张下一张 主主 页页 退退 出出 上一张上一张 25/117一、随机变量一、随机变量 作一次试验,其结果有各种可能。每一个可作一次试验,其结果有各种可能。每一个可能结果都可用一个数来表示,把这些数作为变量能结果都可用一个数来表示,把这些数作为变量x取值范围,则试验结果可用变量取值范围,则试验结果可用变量x来表示。来表示。【例【例4.3】对对100头病畜用某种药品进行治头病畜用某种药品进行治疗,其可能结果是疗,其可能结果是“0头治愈头治愈”、“1头治愈头治愈”、“2头治愈头治愈”、“”、“100头治愈头治愈”。若用。若用x表示治愈头数,则表示治愈头数,则x取值为取值为0、1、2、100。下一张下一张 主主 页页 退退 出出 上一张上一张 26/117 【例【例4.4】孵化一枚种蛋可能结果只有两孵化一枚种蛋可能结果只有两种,即种,即“孵出小鸡孵出小鸡”与与“未孵出小鸡未孵出小鸡”。若用若用变量变量x表示试验两种结果,则可令表示试验两种结果,则可令x=0表示表示“未孵出小鸡未孵出小鸡”,x=1表示表示“孵出小鸡孵出小鸡”。【例【例4.5】测定某品种猪初生重测定某品种猪初生重,表示测,表示测定定 结结 果果 变变 量量 x 所所 取值为一个特定范围取值为一个特定范围(a,b),如,如0.51.5kg,x值能够是这个范围值能够是这个范围内任何实数。内任何实数。下一张下一张 主主 页页 退退 出出 上一张上一张 27/117 假如表示试验结果变量假如表示试验结果变量x,其可能取值至,其可能取值至多为可列个多为可列个,且,且 以各种确定概率取这些不一以各种确定概率取这些不一样值样值,则则 称称 x 为为 离离 散散 型型 随随 机机 变变 量量 (discrete random variable);假如表示试验结果变量假如表示试验结果变量x,其可能取值为,其可能取值为某范围内任何数值某范围内任何数值,且,且x在其取值范围内任一在其取值范围内任一区间中取值时,其概率是确定,则称区间中取值时,其概率是确定,则称x为为 连续连续 型型 随随 机机 变变 量量 (continuous random variable)。下一张下一张 主主 页页 退退 出出 上一张上一张 28/117二、离散型随机变量概率分布二、离散型随机变量概率分布 要了解离散型随机变量要了解离散型随机变量x统计规律,就必须统计规律,就必须 知知 道它一切可能值道它一切可能值xi及取每种可能值概率及取每种可能值概率pi。假如我们将离散型随机变量假如我们将离散型随机变量x一切可能取值一切可能取值xi (i i=1,2,)=1,2,),及其对应概率,及其对应概率pi,记作,记作 P(x=xi)=pi i=1,2,(43)(43)则称则称(43)式为)式为离散型随机变量离散型随机变量x概率概率分布或分布分布或分布。惯用。惯用 分分 布布 列列(distribution series)来表示离散型随机变量:来表示离散型随机变量:下一张下一张 主主 页页 退退 出出 上一张上一张 29/117 x1 x2 xn .p1 p2 pn 显然离散型随机变量概率分布含有显然离散型随机变量概率分布含有pi0和和pi=1这两个基本性质。这两个基本性质。三、连续型随机变量概率分布三、连续型随机变量概率分布 连续型随机变量连续型随机变量(如体长、体重、蛋重如体长、体重、蛋重)概概率分布不能用分布列来表示,率分布不能用分布列来表示,因为其可能取值因为其可能取值是不可数。我们改用随机变量是不可数。我们改用随机变量x在某个区间内取在某个区间内取值概率值概率P(axb)来表示。来表示。下面经过频率分下面经过频率分布密度曲线给予说明。布密度曲线给予说明。下一张下一张 主主 页页 退退 出出 上一张上一张 30/117 由表由表27作作126头基础母羊体重资料频率头基础母羊体重资料频率分布直方图分布直方图,见图,见图41,图中纵座标取频率与,图中纵座标取频率与组距比值组距比值。能够构想。能够构想,假如样本取得越来越大,假如样本取得越来越大(n+),组分得越来越细,组分得越来越细(i0),某一范围,某一范围内频率将趋近于一个稳定值内频率将趋近于一个稳定值 概率。这时概率。这时,频率分布直方图各个直方上端中点联线频率分布直方图各个直方上端中点联线 频频率分布折线将逐步趋向于一条曲线,换句话说,率分布折线将逐步趋向于一条曲线,换句话说,当当n+、i0时,时,频率分布折线频率分布折线下一张下一张 主主 页页 退退 出出 上一张上一张 31/117极限是一条稳定函数曲线极限是一条稳定函数曲线。对于样本是取自连对于样本是取自连续型随机变量情况续型随机变量情况,这条函数曲线将是光滑。,这条函数曲线将是光滑。这条曲线排除了抽样和测量误差这条曲线排除了抽样和测量误差,完完 全全 反应反应了基础母羊体重变动规律。了基础母羊体重变动规律。这条曲线叫这条曲线叫概率分概率分布密度曲线布密度曲线,对应函数叫,对应函数叫 概率分布密度函数概率分布密度函数。下一张下一张 主主 页页 退退 出出 上一张上一张 32/117 (44)式式 为为 连连 续续 型型 随机变量随机变量 x 在在 区区间间a,b)上取值概率表示式。可见,连续型随)上取值概率表示式。可见,连续型随机变量概率由概率分布密度函数确定。机变量概率由概率分布密度函数确定。图图4-1 表表2-7资料分布曲线资料分布曲线 若记体若记体 重概率分布密度函数为重概率分布密度函数为f(x),则,则x取值于区间取值于区间a,b)概率为图中阴影部分面积,)概率为图中阴影部分面积,即即 P(axb)=(4-4)33/117 连续型随机变量概率分布性质:连续型随机变量概率分布性质:1、分布密度函数总是大于或等于、分布密度函数总是大于或等于0,即,即f(x)0;2、当随机变量、当随机变量x取某一特定值时,其概率取某一特定值时,其概率等于等于0;即;即 (c为任意实数为任意实数)因而,对于连续型随机变量,仅研究其在因而,对于连续型随机变量,仅研究其在某一个区间内取值概率,而不去讨论取某一个某一个区间内取值概率,而不去讨论取某一个值概率。值概率。下一张下一张 主主 页页 退退 出出 上一张上一张 34/117 3、在在 一次试验中一次试验中 随机变量随机变量x之取值之取值 必在必在-x+范围内,为一必定事件。所以范围内,为一必定事件。所以 (4-5)(4-5)(45)式表示分布密度曲线下、横轴上全式表示分布密度曲线下、横轴上全 部面积为部面积为1。下一张下一张 主主 页页 退退 出出 上一张上一张 35/117第三节第三节 正态分布正态分布 正态分布是一个很主要连续型随机变量概正态分布是一个很主要连续型随机变量概率分布。生物现象中有许多变量是服从或近似率分布。生物现象中有许多变量是服从或近似服从正态分布。许多统计分析方法都是以正态服从正态分布。许多统计分析方法都是以正态分布为基础。另外,还有不少随机变量概率分分布为基础。另外,还有不少随机变量概率分布在一定条件下以正态分布为其极限分布。所布在一定条件下以正态分布为其极限分布。所以在统计学中,正态分布不论在理论研究上还以在统计学中,正态分布不论在理论研究上还是实际应用中是实际应用中 ,均占有主要地位。均占有主要地位。下一张下一张 主主 页页 退退 出出 上一张上一张 36/117一、正态分布定义及其特征一、正态分布定义及其特征 (一)(一)正态分布定义正态分布定义 若连续型随机变量若连续型随机变量x概率分布密度函数为概率分布密度函数为 (4-6)其中其中为平均数,为平均数,2为方差,则称随机变为方差,则称随机变量量x服从正态分布服从正态分布(normal distribution),记为记为xN(,2)。对应概率分布函数为。对应概率分布函数为 (4-7)下一张下一张 主主 页页 退退 出出 上一张上一张 37/117 分布密度曲线如分布密度曲线如图图42所表示。所表示。(二二)正态分布特征正态分布特征 1、正态分布密度曲线是单峰、对称悬钟形、正态分布密度曲线是单峰、对称悬钟形曲线,对称轴为曲线,对称轴为x=;2、f(x)在在 x=处达处达 到到 极极 大大,极大极大值值 ;3、f(x)是非负函数,以是非负函数,以x轴为渐近线,分轴为渐近线,分布从布从-至至+;下一张下一张 主主 页页 退退 出出 上一张上一张 38/117 4、曲线在、曲线在x=处各有一个拐点,即曲处各有一个拐点,即曲线在线在(-,-)和和(+,+)区间上是下凸,区间上是下凸,在在-,+区间内是上凸;区间内是上凸;5、正态分布有两个参数,即平均数、正态分布有两个参数,即平均数和标和标准差准差。是位置参数,如是位置参数,如图图43所表示。所表示。当当恒恒定时,定时,愈大,则曲线沿愈大,则曲线沿x轴愈向右移动;反之,轴愈向右移动;反之,愈小,曲线沿愈小,曲线沿x轴愈向左移动。轴愈向左移动。是变异度参数,是变异度参数,如如图图44所表示所表示。当当恒定时,恒定时,愈大,表示愈大,表示 x 取值愈分散,取值愈分散,曲线愈曲线愈“胖胖”;愈小,愈小,x取值愈集中在取值愈集中在附近,曲线附近,曲线愈愈“瘦瘦”。下一张下一张 主主 页页 退退 出出 上一张上一张 39/117 6、分布密度曲线与横轴所夹面积为、分布密度曲线与横轴所夹面积为1,即:即:下一张下一张 主主 页页 退退 出出 上一张上一张 40/117 二、标准正态分布二、标准正态分布 由上述正态分布特征可知由上述正态分布特征可知 ,正态分布,正态分布是依赖于参数是依赖于参数和和2 (或或)一簇一簇 分布分布 ,正态曲线之位置及形态随正态曲线之位置及形态随和和2不一样而不不一样而不一样一样。这就给研究详细正态总体带来困难,这就给研究详细正态总体带来困难,需将普通需将普通N(,2)转转 换为换为=0,2=1正态分布。正态分布。41/117 我们称我们称=0,2=1正态分布为标准正态分正态分布为标准正态分布布(standard normal distribution)。标准正态分布概率密度函数及分布函数分别标准正态分布概率密度函数及分布函数分别记作记作(u)和和(u),由,由(4-6)及及(4-7)式得:式得:(4-8)(4-9)随机变量随机变量u服从标准正态分布,记作服从标准正态分布,记作uN(0,1),分布密度曲线如,分布密度曲线如图图45所表示。所表示。下一张下一张 主主 页页 退退 出出 上一张上一张 42/117 对于任何一个服从正态分布对于任何一个服从正态分布N(,2)随机随机变量变量x,都能够经过标准化变换:,都能够经过标准化变换:u=(x-)(4-10)将将 其变换为服从标准正态分布随机变量其变换为服从标准正态分布随机变量u。u 称称 为为 标标 准准 正正 态变量或标准正态离差态变量或标准正态离差(standard normal deviate)。下一张下一张 主主 页页 退退 出出 上一张上一张 43/117三、正态分布概率计算三、正态分布概率计算 (一)标准正态分布概率计算(一)标准正态分布概率计算 设设u服从标准正态分布,则服从标准正态分布,则 u 在在u1,u2)何内取值概率为:何内取值概率为:(u2)(u1)(4-11)而而(u1)与与(u2)可由附表可由附表1查得。查得。下一张下一张 主主 页页 退退 出出 上一张上一张 44/117 比如,比如,u=1.75,1.7放在第一列放在第一列0.05放放在第一行在第一行。在附表在附表1中中,1.7所在行与所在行与 0.05 所在列相交处数值为所在列相交处数值为0.95994,即,即 (1.75)=0.95994 有有 时时 会会 遇遇 到到 给给 定定 (u)值值,例例 如如(u)=0.284,反过来查反过来查u值。这只要在附表值。这只要在附表1中找到与中找到与 0.284 最靠近值最靠近值0.2843,对应行,对应行第一列数第一列数-0.5,对应列第一行数对应列第一行数 值值 0.07,即对应即对应u值为值为 u=-0.57,即,即 (-0.57)=0.284 假如要求更准确假如要求更准确u值,可用线性插值法计算。值,可用线性插值法计算。下一张下一张 主主 页页 退退 出出 上一张上一张 45/117 由由(4-11)式及正态分布对称性可推出以式及正态分布对称性可推出以下关系式,下关系式,再借助附表再借助附表1,便能很方便地计算便能很方便地计算相关概率:相关概率:P(0uu1 1)(u1 1)-0.5 P(uu1 1)=(-u1 1)P(uu1 1)=2(-u1 1)(4-12)P(uu1 11-2(-u1 1)P(u1 1uu2 2)(u2 2)-(u1 1)下一张下一张 主主 页页 退退 出出 上一张上一张 46/117 【例【例4.6】已知已知uN(0,1),试求:,试求:(1)P(u-1.64)?(2)P(u2.58)=?(3)P(u2.56)=?(4)P(0.34u1.53)=?下一张下一张 主主 页页 退退 出出 上一张上一张 47/117 利用利用利用利用(4-12)(4-12)式,查附表式,查附表式,查附表式,查附表1 1得:得:得:得:(1)(1)P P(u u-1.64)=0.05050-1.64)=0.05050 (2)(2)P P(u u2.58)=(-2.58)=0.0249402.58)=(-2.58)=0.024940 (3)(3)P P(u u2.56)2.56)=2(-2.56)=20.005234 =2(-2.56)=20.005234 =0.010468 =0.010468 (4)(4)P P(0.34(0.34u u1.53)1.53)=(1.53)-(0.34)=(1.53)-(0.34)=0.93669-0.6331=0.30389 =0.93669-0.6331=0.30389下一张下一张 主主 页页 退退 出出 上一张上一张 48/117 关于标准正态分布,以下几个概率应该熟记:关于标准正态分布,以下几个概率应该熟记:P(-1u1)=0.6826 P(-2u2)=0.9545 P(-3u3)=0.9973 P(-1.96u1.96)=0.95P(-2.58u2.58)=0.99 图图46 标准正态分布三个惯用概率标准正态分布三个惯用概率下一张下一张 主主 页页 退退 出出 上一张上一张 49/117 u u变量在上述区间以外取值概率分别为:变量在上述区间以外取值概率分别为:变量在上述区间以外取值概率分别为:变量在上述区间以外取值概率分别为:P P(u u1)=2(-1)=1-1)=2(-1)=1-P P(-1(-1u u1)1)=1-0.6826=0.3174 =1-0.6826=0.3174 P P(u u2)=2(-2)2)=2(-2)=1-=1-P P(-2-2u u2 2)=1-0.9545=0.0455 =1-0.9545=0.0455 P P(u u3)=1-0.9973=0.00273)=1-0.9973=0.0027 P P(u u1.96)=1-0.95=0.051.96)=1-0.95=0.05 P P(u u2.58)=1-0.99=0.01 2.58)=1-0.99=0.01 下一张下一张 主主 页页 退退 出出 上一张上一张 50/117 (二)普通正态分布概率计算(二)普通正态分布概率计算 正正 态态 分分 布布 密度曲线和横轴围成一个区域,密度曲线和横轴围成一个区域,其面积为其面积为1,这实际上表明了,这实际上表明了“随机变量随机变量x取值取值在在-与与+之间之间”是一个必定事件,其概率为是一个必定事件,其概率为1。若随机变量若随机变量 x服从正态分布服从正态分布N(,2),则,则x取值落在任意区间取值落在任意区间 x1,x2)概率概率,记作,记作P(x1 x x2),等于,等于图图47 中阴影部分曲边中阴影部分曲边梯形面积。即:梯形面积。即:下一张下一张 主主 页页 退退 出出 上一张上一张 51/117 (4-13)对对(4-13)式作变换式作变换u=(x-),得,得dx=du,故有,故有其中,其中,下一张下一张 主主 页页 退退 出出 上一张上一张 52/117 这表明服从正态分布这表明服从正态分布N(,2)随机变量随机变量x 在在 x1,x2)内取值概率)内取值概率,等等 于服于服 从从 标标 准准 正正 态态 分分 布布 随随 机机 变变 量量 u 在在(x1-)/,(x2-)/)内取值概率)内取值概率。所以,计算普通正态分布概率时,所以,计算普通正态分布概率时,只要将只要将区间上下限作适当变换区间上下限作适当变换(标准化标准化),就可用查标就可用查标准正态分布概率表方法求得概率了。准正态分布概率表方法求得概率了。下一张下一张 主主 页页 退退 出出 上一张上一张 53/117 【例【例【例【例4.74.7】设设设设x x服从服从服从服从=30.26,=30.26,2 2=5.10=5.102 2正态分布,试正态分布,试正态分布,试正态分布,试求求求求P P(21.64(21.64x x32.98)32.98)。令令令令 则则则则u u服从标准正态分布,故服从标准正态分布,故服从标准正态分布,故服从标准正态分布,故 =P P(-1.69(-1.69u u0.53)0.53)=(0.53)-(-1.69)=(0.53)-(-1.69)=0.7019-0.04551 =0.7019-0.04551 =0.6564 =0.6564 下一张下一张 主主 页页 退退 出出 上一张上一张 54/117 关于普通正态分布,以下几个概率关于普通正态分布,以下几个概率(即随即随机变量机变量x落在落在加减不一样倍数加减不一样倍数区间概率区间概率)是是经惯用到。经惯用到。P(-x+)=0.6826 P(-2x+2)=0.9545 P(-3x+3)=0.9973 P(-1.96x+1.96)=0.95 P(-2.58x+2.58)=0.9955/117 上述关于正态分布结论,可用一实例来上述关于正态分布结论,可用一实例来印证。印证。从从图图2-7能够看出能够看出,126头头 基础母羊基础母羊体重资料次数分布靠近正态分布体重资料次数分布靠近正态分布,现,现 依据依据 其其 平均数平均数 =52.26(kg),标,标 准准 差差S=5.10(kg),算出平均数加减不一样倍,算出平均数加减不一样倍数标准差区间内数标准差区间内 所包含次数与频率所包含次数与频率,列于,列于表表42。下一张下一- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 统计 名师 优质课 获奖 课件 市赛课百校 联赛 一等奖
咨信网温馨提示:
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【人****来】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【人****来】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【人****来】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【人****来】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
关于本文