生物统计专题培训市公开课一等奖百校联赛特等奖课件.pptx
《生物统计专题培训市公开课一等奖百校联赛特等奖课件.pptx》由会员分享,可在线阅读,更多相关《生物统计专题培训市公开课一等奖百校联赛特等奖课件.pptx(102页珍藏版)》请在咨信网上搜索。
1、生物统计生物统计生物统计介绍资料整理集中趋势和离散趋势正态分布和抽样分布统计推断相关分析和线性回归第1页生物统计介绍生物统计介绍数理统计:是数学一个分支学科。它主要研究是数理统计:是数学一个分支学科。它主要研究是怎么有效搜集、整理和分析带有随机性数据。怎么有效搜集、整理和分析带有随机性数据。生物统计就是数理统计在生物领域应用。生物统计就是数理统计在生物领域应用。生物统计:是应用于生物学科中当代统计方法生物统计:是应用于生物学科中当代统计方法第2页统计学几个基本概念o试验与事件试验是一定综合条件实现,假定这种综合条件能够任意地重复实现很屡次。事件是试验结果和现象o频率与概率频率=频数/试验次数=
2、m/n概率:是频率稳定值叫随机事件概率o总体和个体总体又称母体,是一个统计问题所研究对象全体。个体:组成总体每一个元素(单元)称为个体 第3页统计学几个基本概念o抽样与样本样本:从总体中抽取一定数量个体进行研究,这部分个体称为样本。随机抽样:是指总体中每个个体都有同等机会进入样本。o参数与统计量参数:是描述总体特征数,在推断统计中总体参数是一个固定值,通常未知。统计量:是样本已知函数。o准确度和准确度准确度也叫准确性是指在调查或试验中某一试验指标性状观察指与真值靠近程度。准确度指调查或试验中同一试验指标或性状重复观察值彼此靠近程度。第4页资料整理o统计表统计表:资料经过汇总后,得到很多说明各种
3、现象统计数字,把这些统计数字按照一定指标次序排列在适当表格内,就组成统计表。统计表种类:简单表、复合表、分组表简单表:由一组横标目和一组纵标目组成复合表:由两组以上横标目和纵标目结合起来,或一组横标目和两组或两组以上纵标目结合起来以表示他们之间关系。第5页资料整理o资料分类计量资料:是用度量衡等计量工具测量后而得到。因为每次测得结果因个体而异,它所以能够作为区分和描述个体之用。表现出变异性或变差特征数,我们称为变数。计数资料:是用计数方式得来。因而这种变数必须用整数来表示。计数资料分类数量化:公称尺度、等级尺度、间距尺度。第6页资料整理o统计图统计图作用:易于了解、易于记忆、便于分析比较、富于
4、鼓动性统计图种类:直方图:是用矩形面积来表示频数分布表中各组数据出现频数。条形图:它是以若干平行柱形长短来表示绝对数或相对数大小图形,可分为单式条图和复式条图。圆形图:对于各项之和为100%者,可用圆形图表示,圆总面积表示事物整体其值为100%。扇形面积表示整体一部分。而且用不一样色彩或线条表示部分。线图:主要用于表示一个动态数量资料。说明事物在时间上改变发展过程。第7页o集中趋势:在统计学中是指一组数据向某一中心值靠拢程度,它反应了一组数据中心点位置所在。o集中趋势指标有:算数平均数、中位数、众数、几何平均数和调和平均数。集中趋势度量集中趋势度量第8页集中趋势指标集中趋势指标o算数平均数:资
5、料中各数和除以变数个数所得到得商,简称平均数。加权平均数第9页集中趋势指标集中趋势指标o中位数:将N个变数按大小次序排列后,假如N为奇数Med=Xk+1,当N为偶数时,Med=(xk+Xk+1)/2o众数:对单峰分布来讲,发生频数最多变数值称为众数,对多峰分布而言,众数是指比较相邻值较大频数变数值,有时没有众数。o几何平均数:N个非负数x1,x2,x3,xN乘积N次方根称为几何平均数。相邻数值增加成百分比关系,可用几何平均数表示他们集中趋势第10页集中趋势指标集中趋势指标o调和平均数:设x1,x2,x3xn都为正数(或全为负数)调和平均数倒数等于这些变数倒数算数平均数。第11页5种平均数关系及
6、评价o三种平均数之间关系1、在完全对称分布情况下,算数平均数,中位数以及众数三者相等。2、在微偏态分布中,众数,中位数以及算术平均数三者关系以下:3、一组数据几何平均数较算术平均数笑,常较其调和平均数为大。第12页离散性度量o离散趋势:在统计学中反应了一组数据差异离散趋势:在统计学中反应了一组数据差异程度。程度。o离散性度量指标:范围、内百分位数、平均离散性度量指标:范围、内百分位数、平均差、方差和标准差以及变异系数。差、方差和标准差以及变异系数。第13页离散性度量指标离散性度量指标o范围:它是样本最大值与最小值差,它也是最简单离散性度量指标。o范围用途:1、能够粗糙预计标准差,假如样本较大,
7、它频数分布靠近正态分布,则样本标准差近似预计值:2、假如样本含量较小,则样本取自正太总体,则用下式预计:第14页离散性度量指标离散性度量指标o平均绝对离差o相对离散度是一个既能反应离散度,又能反应出集中趋势指标。最惯用是标准差与平均数之比,称为变异系数:第15页离散性度量指标离散性度量指标o标准差:如一样本有n个观察指x1,x2,xn,设其算数平均数为 ,则该样本标准差为:o方差就是标准差平方第16页正态分布o分布分布分布函数分布函数F(x)总体中,个体值小于总体中,个体值小于x所占百分比。所占百分比。分布密度分布密度函数函数f(x),它性质是:它性质是:即落在区间(即落在区间(a,b)内个体
8、百分比等于)内个体百分比等于f(x)在(在(a,b)上积)上积分,他对一切分,他对一切a=b均成立。均成立。o随机变量分为离散性随机变量和连续性随机变量随机变量分为离散性随机变量和连续性随机变量第17页随机变量分类随机变量分类 如如“取到次品个数取到次品个数”;“110天天收到呼叫次天天收到呼叫次 数数”等等.随随机机变变量量离散型随机变量离散型随机变量全部取值能够逐一全部取值能够逐一一一列举一一列举比如,比如,“电视机寿命电视机寿命”;实际中常碰到实际中常碰到“测量误差测量误差”等等.全部可能取值不但全部可能取值不但无穷多,而且还不能无穷多,而且还不能一一列举,而是充满一一列举,而是充满一个
9、区间一个区间.非离散型随机变量非离散型随机变量 其中一个主要类型为其中一个主要类型为连连续型随机变量续型随机变量.第18页正太分布o正态分布:若随机变量X分布密度函数是:记作:XN(,)o正态分布性质:1、只有一个峰,峰值在x=处,总体平均数、中位数、众数三者重合在 处。2、图形关于直线x=处对称3、正态曲线分布在x轴上方,而且横轴为正太曲线左右延伸渐近线。第19页正态分布o正态分布性质:4、参数 决定图形形状,越大,图形显得矮和宽,它越小,图形显得高与窄。5、变量做线性变换 若XN(,),如对X做线性变换:则ZN(0,1)。则Z服从均数为0,方 差为1正太分布,我们将这么正态分布称为标准正态
10、分布。6、正太曲线在 或对标准正态分布 各有一个拐点。第20页抽样和抽样分布概念o为何要抽样?n数理统计中总体演化;n总体分布未知,不过又需要了解总体分布;o什么是抽样分布?n总体和样本关系:样本含有和总体相同分布;n样本能够结构统计量第21页三种常见分布三种常见分布分布定义 为独立同分布于标准总体总体N(0,1)随机变量列,则称随机变量:所服从分布为自由度是n 分布,记为第22页 分布三个关键点独立同分布随机变量序列独立同分布随机变量序列随机变量服从标准正态分布随机变量服从标准正态分布新结构随机变量为原随机变量平方和新结构随机变量为原随机变量平方和新随机变量服从新随机变量服从新随机变量服从新
11、随机变量服从自由度为自由度为自由度为自由度为n n卡方卡方卡方卡方分布分布分布分布第23页(2)t-(2)t-分布分布第24页t分布三个关键点分子是标准正态随机变量分子是标准正态随机变量分母是自由度为分母是自由度为n卡方随机变量卡方随机变量分子分母相互独立,且满足结构公式分子分母相互独立,且满足结构公式新随机变量服从新随机变量服从新随机变量服从新随机变量服从自由度为自由度为自由度为自由度为n nt t分布分布分布分布第25页t分布图像基本性质基本性质:(1)f(t)(1)f(t)关于t=0t=0(纵轴)对称。(2)f(t)(2)f(t)极限为XN(0,1)密度函数第26页 (3 3)F F分布
12、分布第27页F分布三个关键点:分子是自由度为分子是自由度为n1卡方随机变量卡方随机变量分母是自由度为分母是自由度为n2卡方随机变量卡方随机变量分子分母相互独立,且满足结构公式分子分母相互独立,且满足结构公式新随机变量服从新随机变量服从新随机变量服从新随机变量服从第一自由度为第一自由度为第一自由度为第一自由度为n n1 1第二自由度为第二自由度为第二自由度为第二自由度为n n2 2F F分布分布分布分布第28页统统计计推推断断通通过过样样本本推推断断总总体体,是是计计算算生生物物学学一一个个惯惯用用方方法法,普普通通有有两两种种方方法法。一一是是首首先先对对所所预预计计总总体体提提出出一一个个假
13、假设设(hypothesis),比比如如假假设设这这个个总总体体平平均均数数等等于于某某个个值值0(0),然然后后,经经过过样样本本数数据据去去推推断断这这个个假假设设是是否否能能够够接接收收。假假如如能能够够接接收收,样样本本很很可可能能抽抽自自这这个个总总体体;不不然然,很很可可能能不不是是抽抽自自这这个个总总体体。二二是是经经过过样样本本统统计计量量预预计计总总体体参参量量。前前一一个个路路径径称称为为统统计计假假设设检检验验(statistical test ofhypothesis),后后一一个个成成 为为 总总 体体 参参 量量 预预 计计 (estimation ofpopula
14、tionparameter)。这这两两种种不不一一样样统统计推断方法,在实践应用中可相互参考使用。计推断方法,在实践应用中可相互参考使用。第29页一、单个样本统计假设检验一、单个样本统计假设检验假设假设总总体体平平均均数数是是未未知知,为为了了得得到到对对总总体体平平均均数数推推断断,能能够够假假设设总总体体平平均均数数等于某一给定值等于某一给定值 H0:0备择假设记为备择假设记为HAHA:0、HA:0及及HA:0。第30页备备择择假假设设提提出出需需视视情情况况而而定定。若若已已知知不不可可能能大大于于0,则则HA:0。若若已已知知不不可可能能小小于于0,则则HA:0。若若考考查查目目标标只
15、只是是判判断断是是否否等等于于0,并并不不关关心心终终究究是是0还还是是0,或或者者并并不不知知道道不不可可能能大大于于0或是或是不可能小于不可能小于0,这时,这时HA:0。第31页2.小概率原理小概率原理小小概概率率事事件件,在在一一次次试试验验中中,几几乎乎是是不不会会发发生生。若若依依据据一一定定假假设设条条件件计计算算出出来来该该事事件件发发生生概概率率很很小小,而而在在一一次次试试验验中中,它它竟竟然然发发生生了了,则则能能够够认认为为假假设设条条件件不不正正确确。所所以以,否否定定假设。假设。第32页标准化样本平均数标准化样本平均数服服从从标标准准正正态态分分布布N(0,1),即即
16、P(Uu)或或P(Uu)或或P(|U|u)值值。或或者者说说,能能够够得得到到 抽抽自自平平均均数数为为0 总总体体概概率率。假假如如得得到到概概率率值值很很小小,则则抽抽自自平平均均数数为为0 总总体体事事件件是是一一个个小小概概率率事事件件。依依据据小小概概率率原原理理,它它在在一一次次试试验验中中几几乎乎是是不不会会发发生生,但但实实际际上上它它发发生生了了,说说明明假假设设条条件件不不正正确确,即即并并不不等等于于0,拒拒绝绝零零假假设设而而接收备择假设。接收备择假设。第33页依依据据上上述述原原理理所所建建立立起起来来检检验验方方法法称称为为显显著著性性检检验验(significan
17、cetest)。终终究究概概率率小小到到什什么么程程度度算算是是小小概概率率,要要依依据据实实际际情情况况或或试试验验要要求求而而定定。计计算算生生物物工工作作中中,通通常常要要求求0.05或或0.01以以下下为为小小概概率率0.05或或0.01或或其其它它值值)称称为为显显著著性性水水平平(significance level),记记为为“a a”。第34页3单单侧侧检检验验(one-sidedtest)与与双双侧侧检检验验(two-sidedtest)选择做单侧检验或双侧检验,应依据问题要求选择做单侧检验或双侧检验,应依据问题要求而定。假若问题只要求判断而定。假若问题只要求判断是否等于是否
18、等于0,而不是大,而不是大于于0或小于或小于0时,应做时,应做双侧检验双侧检验。假如事先能够判。假如事先能够判断断不可能大于不可能大于0,或,或不可能小于不可能小于0时,则可做时,则可做单侧检验单侧检验。因单侧检验区分力更强些,所以在可能情。因单侧检验区分力更强些,所以在可能情况下尽可能做单侧检验。况下尽可能做单侧检验。第35页4两种类型错误两种类型错误在在H0是是真真实实情情况况下下,因因为为随随机机性性依依然然有有可可能能落落在在拒拒绝绝域域内内,依依据据小小概概率率原原理理,这这时时将将拒拒绝绝H0。这这么么拒拒绝绝是是错错误误。假假如如假假设设是是正正确确,却却错错误误地地拒拒绝绝了了
19、它它,称称为为犯犯型型错错误误(typeerror)。犯犯型型错错误误概概率率不会超出不会超出a a。a aP(型错误)型错误)P(接收(接收H0|H0是正确,是正确,0)。)。第36页如在单侧检验时所得到结论是拒绝如在单侧检验时所得到结论是拒绝H0:0。得到这么结论是要冒一定风险,因为在。得到这么结论是要冒一定风险,因为在a a0.05水水平上,拒绝平上,拒绝H0。所以平均。所以平均100次次H0会有会有5次是错误。次是错误。或者说,每次拒绝都要冒或者说,每次拒绝都要冒5%错误推断风险。假如在错误推断风险。假如在a a0.01水平上拒绝水平上拒绝H0。所冒风险要小一些,即平。所冒风险要小一些
20、,即平均每拒绝均每拒绝100次次H0,会有,会有1次是错误。或者说,每次次是错误。或者说,每次拒绝都要冒拒绝都要冒1%推断错误风险。推断错误风险。第37页o 其次,接收H0也不能说H0一定是正确。当事实上不等于0而等于另外值1 时,也有落入接收域可能。当0 但错误地接收了0 假设时所犯错误称为型错误(type error)。犯型错误概率记为b,可以表示为:o b1 P(型错误)P(接收H0|H0是错误,1)。第38页关于两种类型错误,还有以下几点需要说明。关于两种类型错误,还有以下几点需要说明。(1)当)当1愈靠近愈靠近0时犯时犯型错误概率愈大;当型错误概率愈大;当1愈远离愈远离0时犯时犯型错
21、误概率愈小。因为犯型错误概率愈小。因为犯型错误型错误概率与概率与1相关,所以相关,所以b b应添加下标应添加下标1,记为,记为b b1 。b b1 表示,当实际上表示,当实际上1而错误地接收而错误地接收0概概率。(率。(2)在)在n 和和固定时,为了降低犯固定时,为了降低犯型错误概型错误概率率a a,结果必定增加犯,结果必定增加犯型错误概率型错误概率b b。反之,降低。反之,降低b b必定增加必定增加a a。(3)为了同时降低为了同时降低b b和和a a就需增加样本就需增加样本含量。含量。第39页(二)单个样本显著性检验程序二)单个样本显著性检验程序总总而而言言之之,单单个个样样本本显显著著性
22、性检检验验基基本本程程序序归归纳纳以下:以下:1.假假设设:零零假假设设是是假假设设检检验验基基础础。它它可可能能有有以以下下几几个个起起源源(1)依依据据以以往往经经验验或或者者依依据据一一些些试试验验结结果果,(2)依依据据某某种种理理论论或或某某种种模模型型,(3)依依据据预预先先所所做某种要求而提出。做某种要求而提出。与与零零假假设设对对立立是是备备择择假假设设。备备择择假假设设是是总总体体参参量量中中除除去去零零假假设设以以外外某某个个值值或或一一些些值值。它它可可能能有有以以下下几几个个起起源源(1)除除零零假假设设以以外外可可能能值值,(2)担担心心会会出出现现值值,(3)希希望
23、望出出现现值值,(4)有有主主要要经经济济意意义义和其它意义值。和其它意义值。第40页2.显显著著性性水水平平:依依据据问问题题要要求求,要要求求显显著著性性水水平平。对对于于试试验验条条件件不不易易控控制制或或轻轻易易产产生生较较大大误误差差试试验验,如如一一些些生生化化试试验验,能能够够将将a a定定得得宽宽一一些些,如如a a0.10。对对于于轻轻易易产产生生严严重重后后果果一一些些试试验验,如如药药品品毒毒性性试试验验,a a能能够定得严一些,如够定得严一些,如a a0.01。3.两两种种类类型型错错误误:前前面面已已经经讲讲过过,在在样样本本含含量量相相同同情情况况下下,降降低低型型
24、错错误误必必定定会会增增加加型型错错误误。所所以以,在在要要求求显显著著性性水水平平时时,就就应应该该考考虑虑这这两两种种错错误误中中哪哪一一个个对对试试验验结结果果有有严严重重影影响响。普普通通来来说说,a a 不不宜宜定定太太严严,a a 定定得得太太严严必必定定增增加加b b。在在条条件件许许可可情情况况下下,尽尽可可能能增加样本含量增加样本含量n。第41页4.确确定定应应该该使使用用检检验验方方法法:对对平平均均数数做做检检验验,分分为为两两种种情情况况,s s2 2已已知知时时做做u检检验验,s s2 2未未知知时时用用t 检检验验,标标准差用准差用c c2检验。检验。5.建立在建立
25、在a a 水平上水平上H0拒绝域拒绝域:若统计量值;落在拒绝:若统计量值;落在拒绝域内,则拒绝域内,则拒绝H0而接收而接收HA。在做单侧检验时,拒绝。在做单侧检验时,拒绝域只在零假设一侧有一个区间。做双侧检验时,拒绝域只在零假设一侧有一个区间。做双侧检验时,拒绝域在零假设两侧各有一个区间。域在零假设两侧各有一个区间。第42页6.对对推推断断解解释释:若若统统计计量量值值落落在在接接收收域域内内,决决不不是是说说总总体体参参量量值值一一定定等等于于零零假假设设值值。对对于于接接收收q qq q0 0这这一一零假设能够有以下几个解释:零假设能够有以下几个解释:(1)零零假假设设值值是是真真实实,并
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 统计 专题 培训 公开 一等奖 联赛 特等奖 课件
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【精****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【精****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。