分析化学中的数据处理ppt精选课件.ppt
《分析化学中的数据处理ppt精选课件.ppt》由会员分享,可在线阅读,更多相关《分析化学中的数据处理ppt精选课件.ppt(58页珍藏版)》请在咨信网上搜索。
1、第第7章章分析化学中的数据处理分析化学中的数据处理 7.1标准偏差标准偏差(标准差或均方误差)(标准差或均方误差)7.2随机误差的正态分布随机误差的正态分布7.3少量数据的统计处理少量数据的统计处理7.4误差的传递误差的传递7.5回归分析回归分析7.6提高分析结果准确度的方法提高分析结果准确度的方法.几个概念(术语)几个概念(术语)1、总体(母体)、总体(母体)所研究对象的某特性值的全体。所研究对象的某特性值的全体。2、个体、个体总体中的每一个单元,指全体中的一个单位总体中的每一个单元,指全体中的一个单位或某一次测定。或某一次测定。3、样本(子样)、样本(子样)从总体中随机抽出的一组测量值或指
2、总体的从总体中随机抽出的一组测量值或指总体的一个部分。一个部分。4、样本容量(样本大小)、样本容量(样本大小)指样本中个体的数目,或样本中测量值数目。指样本中个体的数目,或样本中测量值数目。.总体、个体、样本、样本容量间的关系总体、个体、样本、样本容量间的关系当当n时:时:又又n20次,次,有限次有限次测量,且无系统误差测量,且无系统误差当当n时:时:n20次,次,无限次无限次测量,且无系统误差测量,且无系统误差个体 样本平均值 样本容量总体平均值样本平均偏差总体平均偏差.7.1标准偏差标准偏差(标准差或均方误差)(标准差或均方误差)7.1.1总体标准偏差总体标准偏差当当n时:时:测量值测量值
3、x对总体平均值对总体平均值的偏离用的偏离用表示。表示。(此式应用于此式应用于n,=xT;无系统误差;无系统误差)式中:式中:差方和差方和(它能更好地说明数据的分散程度)(它能更好地说明数据的分散程度).7.1.2样本标准偏差样本标准偏差S(n为有限值,一般为有限值,一般20且无系统误差)且无系统误差)同样:同样:式中式中差方和差方和(即偏差的平方和)(即偏差的平方和)S与与比较:比较:(1)用)用代替了代替了;(;(2)用)用n1代替了代替了n。式中:式中:n-1=f自由度自由度标准偏差的计算:标准偏差的计算:(等效式,可直接利用测量数据计算)(等效式,可直接利用测量数据计算).7.1.3相对
4、标准偏差相对标准偏差(变异系数或变动系数)(变异系数或变动系数)相对标准偏差相对标准偏差=(或(或1000)7.1.4标准偏差标准偏差(或(或s)与平均偏差)与平均偏差(或或)的异同点的异同点1、不必考虑偏差的正负号、不必考虑偏差的正负号2、(或(或s)增强了大偏差数据的作用)增强了大偏差数据的作用如如P243-二组数据:二组数据:可见:可见:S3、与与的关系的关系统计学证明:统计学证明:当当n时,时,=0.8(即(即),或),或4=3(但有的书中也有(但有的书中也有=0.8S或或4=3S)。)。XminXmaxS数据1-0.4+0.40.240.28数据2-0.7+0.50.240.33.7
5、.1.5平均值的标准偏差平均值的标准偏差 统计学上证明:统计学上证明:(无限次测量)(无限次测量)或:或:(有限次测量)(有限次测量).可见:可见:(1)且是且是S的的倍,即:平倍,即:平均值的误差按测定次数的比例减小;均值的误差按测定次数的比例减小;(2)上式的意义:)上式的意义:(3)增加测定次数)增加测定次数n,可以提高测,可以提高测定结果的精密度,但事实上增加定结果的精密度,但事实上增加n所取得的效果是有限制的。所取得的效果是有限制的。即:4次测量时:是S的1/2倍 9次测量时:是S的1/3倍 酬答依次减小 25次测量时:是S的1/5倍.同理:同理:单次测量的单次测量的()与平均值的)
6、与平均值的间也有:间也有:(无限次测量)(无限次测量)(有限次测量)(有限次测量).7.2随机误差的正态分布随机误差的正态分布 7.2.1频数分布频数分布 频数(频数(ni)每组中出现的数据个数每组中出现的数据个数相对频数(或频率)相对频数(或频率)频率密度频率密度以频数(或频率密度)以频数(或频率密度)组值范围组值范围作图,得频数(或频率密度)分布作图,得频数(或频率密度)分布直方图。直方图。(见(见P245-图图7-1).7.2.2正态分布正态分布(高斯(高斯G.F.Gauss分布)分布)对上述分析数据进行整理时,数据具有以下特性对上述分析数据进行整理时,数据具有以下特性:向某中心值集中的
7、趋势;向某中心值集中的趋势;偏离此中心值的倾向。偏离此中心值的倾向。为明确表达数据的特性,我们通常为明确表达数据的特性,我们通常用两个特性参数来表征一组数据:用两个特性参数来表征一组数据:(1)数据的集中趋势数据的集中趋势(2)数据的离散倾向数据的离散倾向1、正态分布曲线、正态分布曲线.式中:式中:y相当于测量值相当于测量值x出现的频率密度出现的频率密度(或概率密度)(或概率密度)相当于总体平均值相当于总体平均值相当于曲线最高点对应的横坐标值,表征数据的集中趋势相当于曲线最高点对应的横坐标值,表征数据的集中趋势总体标准差总体标准差相当于相当于到曲线两拐点之一的距离,表征数据的分散程度到曲线两拐
8、点之一的距离,表征数据的分散程度x(自变量)(自变量)个别测量值个别测量值x-代表测量值对代表测量值对的偏离的偏离(表征随机误差)(表征随机误差).随机误差有以下规律随机误差有以下规律:(1)单峰性)单峰性当当x=时时(无系统误差时无系统误差时=xT),ymax体现了测量体现了测量值的集中趋势,或值的集中趋势,或()是最佳值或最可信赖值是最佳值或最可信赖值;(2)对称性)对称性曲线以曲线以x=为对称轴,呈为对称轴,呈钟形对称钟形对称,说明,说明正负误正负误差出现的机率相等差出现的机率相等;(3)有界性)有界性当当x+或或x时,曲线以时,曲线以x轴为渐近线,即:轴为渐近线,即:大误差出现机率小,
9、小误差出现机率大大误差出现机率小,小误差出现机率大;(4)当)当x=时时概率密度概率密度测量值落在测量值落在dx 范围内的概率范围内的概率.当当时,数据分散,分布曲线时,数据分散,分布曲线平坦平坦(矮胖)(矮胖);当;当时,数据集时,数据集中,分布曲线尖锐中,分布曲线尖锐(高瘦)(高瘦)。当当相同,相同,不同时不同时,曲线形状,曲线形状一致,而位置发生左(或右)移一致,而位置发生左(或右)移,所以所以的大小代表数据集中于何处。的大小代表数据集中于何处。(5)所以只要)所以只要、确定之后,确定之后,分布曲线便确定下来,分布曲线便确定下来,这种分布曲线这种分布曲线记作:记作:.2、标准正态分布曲线
10、、标准正态分布曲线为一方便求出某区间的概率,将横坐标进行变量代换为一方便求出某区间的概率,将横坐标进行变量代换。定义:定义:(即:以(即:以为单位来表征随机误差)为单位来表征随机误差)则:则:概率概率即即这样的曲线称之这样的曲线称之标准正态分布曲线标准正态分布曲线,记作记作N(0,1).标准正态分布曲线的特征是标准正态分布曲线的特征是:(1)当)当X=时,时,y有极值,有极值,当当=1时时(2)正负误差出现的机会均等;)正负误差出现的机会均等;(3)大误差出现的概率小,小)大误差出现的概率小,小误差出现的概率大。误差出现的概率大。.7.2.3随机误差的区间概率随机误差的区间概率实际分析工作中,
11、对误差有两类问题需回答:实际分析工作中,对误差有两类问题需回答:(1)某一给定范围的测定,这些测定出现的机会是)某一给定范围的测定,这些测定出现的机会是多少?多少?(2)为保证测定有一定把握,这些测定的误差可以)为保证测定有一定把握,这些测定的误差可以要求在什么范围内?要求在什么范围内?以上这些问题的回答都要知道以上这些问题的回答都要知道误差的区间概率误差的区间概率,(即概率密度的积分)(即概率密度的积分).正态分布曲线正态分布曲线y与横轴所夹面积表示全部数据出与横轴所夹面积表示全部数据出现的概率的总和,显然:现的概率的总和,显然:曲线与横轴间所夹面积曲线与横轴间所夹面积=正态分布密度函数在正
12、态分布密度函数在x+区间的积分值,区间的积分值,它代表了各种大小偏它代表了各种大小偏差的本样值出现概率的总和。差的本样值出现概率的总和。.或:或:某范围内测量值出现的某范围内测量值出现的概率概率=该部分面积该部分面积/总面总面积积或:取不同或:取不同u值对值对积分得到。积分得到。P248-表表7-2为:为:的的积分值即积分值即概率概率单边值。单边值。.注意:注意:(1)表中积分值的上下限为)表中积分值的上下限为0u(单边),若考虑(单边),若考虑|u|时,应将积分值时,应将积分值2(双边)(双边),同样:,同样:若考虑若考虑|u|以外的概率以外的概率=12P(双边)(双边)或或u的概率的概率=
13、0.5P。(2)由此表可)由此表可计算计算随机误差或测量值出现在某区间随机误差或测量值出现在某区间内(或外)的概率。内(或外)的概率。(3)此表的另一个应用:)此表的另一个应用:可以从概率倒过来找误差可以从概率倒过来找误差界限(范围)界限(范围).可见:可见:随机误差超过随机误差超过3的测量值出现的概率很小(仅的测量值出现的概率很小(仅0.3%),),一般这样的极端值可舍弃(所以常将一般这样的极端值可舍弃(所以常将3称之随机称之随机误差的极限值)。误差的极限值)。随机误差出现的区间随机误差出现的区间(双边)(双边)测量值(测量值(x=u)出现的区间(双边)出现的区间(双边)概概 率率=1x=1
14、0.34132=0.6826=1.96x=1.960.95=2x=20.47732=0.955=2.58x=2.580.99=3x=30.49872=0.997.例例1:某年全国参加高考的学生化学成绩平均值为某年全国参加高考的学生化学成绩平均值为=75分,分,=10分,若满分为分,若满分为100分,总分为分,总分为120分,计算:高于分,计算:高于100分和分和不及格(低于不及格(低于60分)学生的概率。分)学生的概率。解:解:x=ux=100时:时:x=60时:时:查查P248-表表7-2知:知:|u|=2.5时,时,P=0.4938|u|=1.5时,时,P=0.4332。高于高于100分学
15、生概率为:分学生概率为:0.5000-0.4938=0.062低于低于60分学生概率为:分学生概率为:0.5000-0.4332=0.0668.例例2:求测量值落在区间(求测量值落在区间(-0.7,+0.7)的概率。)的概率。解:解:,x=u当当u=0.7时,时,查查P248-表表7-2知知:P=0.2580求得其概率求得其概率P=0.25802=0.5160=51.6%例例3:求测量值落在(求测量值落在(-0.4,+1.0)区间的概率)区间的概率解:解:|u1|=0.4时,时,查查P248-表表7-2知知:P=0.1554|u2|=1.0时,时,查查P248-表表7-2知知:P=0.3413
16、求得其概率求得其概率P=0.1554+0.3413=0.4967(49.67%)可见:当两区间宽度相等时,测量值落在对称区间的概率大可见:当两区间宽度相等时,测量值落在对称区间的概率大于不对称区间的概率,这种现象对正态分布来说是普遍的。于不对称区间的概率,这种现象对正态分布来说是普遍的。.例例4:某班学生某班学生117个数据基本遵从正态分布个数据基本遵从正态分布N(66.62,(0.21)2),求测量值落在(求测量值落在(66.1567.04)中的概率。)中的概率。解:解:=66.62,=0.21,而,而当当x1=67.04时,时,查得,查得P1=0.4773当当x2=66.15时,时,查得,
17、查得P2=0.4861P=0.4773+0.4861=0.9634(96.34%)同理:落在同理:落在66.1567.04以外的概率以外的概率=1-96.34%=3.66%(4%)理论上约有理论上约有1173.66%=4.28=41173.66%=4.28=4个数据落在上述范围以外个数据落在上述范围以外(事实也如此),(事实也如此),故:这批数据的确符合正态分布。故:这批数据的确符合正态分布。.7.3少量数据的统计处理少量数据的统计处理只有当只有当n时,时,这时才能准确无误地找到,这时才能准确无误地找到,显,显然,这是做不到的,实际工作中,涉及的测量数据通常不多,然,这是做不到的,实际工作中,
18、涉及的测量数据通常不多,此时得到的此时得到的总带有一定的不确定性,由于总带有一定的不确定性,由于xT不知,所以不知,所以是是算不出来的。若以算不出来的。若以代替代替xT,以,以S代替代替,而又按理论上的正,而又按理论上的正态分布来处理实际问题,是不合理的,甚至可能得到错误的态分布来处理实际问题,是不合理的,甚至可能得到错误的判断。判断。为了解决用统计方法处理有限次测量数据,并能合理为了解决用统计方法处理有限次测量数据,并能合理的地推断总体的特性问题的地推断总体的特性问题,英国统计学家兼化学家戈塞特,英国统计学家兼化学家戈塞特(W.S.Gosset)以笔名)以笔名“student”发表了其研究工
19、作,提出发表了其研究工作,提出在在统计处理少量实验数据时,为了补偿以统计处理少量实验数据时,为了补偿以S代替代替带来的误差,带来的误差,可以根据测量数据的多少,用另一数值可以根据测量数据的多少,用另一数值“t”代替代替“u”,这一代替这一代替和补偿的办法称之和补偿的办法称之“t分布分布”或或“学生氏学生氏t”法。法。.7.3.1t分布曲线分布曲线在进行有限次测量时,用在进行有限次测量时,用S代替代替所带来的误差,用一新所带来的误差,用一新的量的量“t”来补偿。来补偿。t值的定义为:值的定义为:(对应(对应)注:有些书中定义:注:有些书中定义:在在t分布曲线中:分布曲线中:纵坐标纵坐标概率密度概
20、率密度横坐标横坐标t值。值。0.4.可见:可见:当当n时,时,t分布分布正态分布。同理:正态分布。同理:t分布曲线下某分布曲线下某区间的面积也表示随机误差在该区间内的概率。区间的面积也表示随机误差在该区间内的概率。t分布中,分布中,t值随概率和值随概率和f值变化。值变化。(不同概率和(不同概率和f值对应的值对应的t值,见值,见P250-表表7-3)注意:注意:(1)表中:)表中:P置信度置信度(置信概率)(置信概率),它表示在某,它表示在某t值时,值时,测量值测量值x落在落在ts范围内的概率范围内的概率(或代表我们相信测量值(或代表我们相信测量值x的误差不超过的误差不超过ts的把握);的把握)
21、;(2)显著性水准显著性水准(危险率)(危险率):它表示测量值:它表示测量值x落在落在ts以外的概率,显然:以外的概率,显然:=1P;(3)当)当f时,时,tu(当(当f=20时,时,t与与u已很接近)已很接近)。.7.3.2平均值的置信区间平均值的置信区间分析测量结果可表示为:分析测量结果可表示为:(或:(或:=xts)=xts或或=xu表示表示:在一定置信度时,以测量值在一定置信度时,以测量值x为中心的,包括总体平均为中心的,包括总体平均值在内的可靠性范围值在内的可靠性范围置信区间置信区间。而而或或表示:表示:在一定置信度下,以样本平均值为中心的,包括总体在一定置信度下,以样本平均值为中心
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 分析化学 中的 数据处理 ppt 精选 课件
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【a199****6536】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【a199****6536】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。