关于Poisson分布的检验.doc
《关于Poisson分布的检验.doc》由会员分享,可在线阅读,更多相关《关于Poisson分布的检验.doc(19页珍藏版)》请在咨信网上搜索。
1、17 / 19目 录承诺保证书I1 引言1 1.1 研究背景1 1.2 研究方法及目的12 Poisson分布检验的步骤和基本理论2 2.1 检验步骤2 2.2 检验的基本原理3 3 关于Poisson分布检验的三个案例及实际研究7 3.1 案例分析7 3.2 对单位时间到来顾客数的实际研究13参考文献18英文摘要19 . 关于Poisson分布的检验肖秋光摘要:Poisson分布是概率论中的一种重要离散分布,在许多实际问题中都有着广泛应用.本文概括了检验样本数据是否服从泊松分布的一般方法,主要是对随机数据进行图像模拟估计和利用假设检验原理对给定的临界值进行估计.其中检验是众所周知的拟合优度检
2、验,它能适用于任意的备择假设.另外,通过三个例子进行说明,最后用该方法对实测数据进行了分析和检验,并得出了结论.关键词:Poisson分布 假设检验 独立变量 统计量 1 引言1.1 研究背景 改革开放三十年来随着社会的发展、经济的增长,科学技术日新月异、人民拥有的物质日益丰富、感受到的文化也更加多元、社会的各种法规制度日臻成熟,无论是住房、保险、交通、旅游、高质量产品还是教育、饮食等.其结果是构成了大量的随机数据,而这些数据有没有什么规律可循呢?就需要我们对它进行研究.在现实生活中的许多数据经过人们大量的研究是服从泊松分布的.若通过观察记录得到了一组数据,它是否服从泊松分布,则需要我们对其进
3、行检验.泊松分布是1837年由法国数学家泊松(Poisson S.D.1781-1840)首次提出的.它是概率论中的一种重要的离散型随机变量的概率分布,在理论上和实践中都有广泛的应用.如110报警台24小时接到的报警次数、一定时间内发生的意外事件次数或灾害次数、布匹上的疵点数目、放射性物质放射出的粒子数目等.1.2 研究方法及目的 由于向110报警台的报警是一次次到来的;自然灾害是一次次发生的;放射性粒子是一个个射出的;进入商场的人是一个个到来的 它们都可以看成是一种于随机时刻到来的“质点流”.要对其进行研究,首先,必须收集到有效的数据.其次,由于得到的样本数据通常是实验或统计而来,因此它不能
4、完全的反映事物的本质.我们主要对部分数据进行抽取分析,根据部分数据对全体数据做出推断及判断.因此,研究单位时间内产生的诸多随机变量有助于当事者们对各种新措施、新技术作出更为科学合理的决策.例如,商场每个时段到达的人数不一,通过调查可以确定哪个时段是人流的高峰期,可以在这个时段做一些宣传或促销产生的效益就会比其他时段高,并有效控制成本,使其用最小的投入换来最大的收益.2 Poisson分布检验的步骤及基本理论2.1 检验步骤2.1.1 数据整理 进行Poisson分布的检验时,首先要对收集到的数据进行整理.假设收集到单位时间的量为,然后把这些量按从小到大顺序排列起来,并查出其频数稍加整理制成表格
5、如下: 表 1单位时间的量 012频数 其中满足:2.1.2 用图像对样本数据进行模拟由于图形比较直观,而且样本数据在一定程度上能有效反映总体的分布规律,故可以用样本数据的图像模拟通过对比,对该分布进行初步判断.泊松分布的图形一般为左偏,但随数值的增大,图形趋于对称.图12.1.3 检验得出结论2.2 检验的基本理论2.2.1 假设检验 假设检验是对总体的分布函数形式或分布的某些参数作出某些可能的假设,然后根据所得的样本数据,对假设的正确性作出判断.假设检验的步骤:根据问题建立原假设和备择假设原假设是设总体参数等于某一数值,而备则假设是根据研究的目的来确定:可采用双侧检验,也可采用单侧检验.确
6、定单、双侧检验的同时,也就确定了接受域和拒绝域的位置. 选择适当的样本统计量,并确定以为真时的抽样分布 这一步是假设检验的关键,需要根据已知条件找到一个包含待检验总体参数和样本数据的已知分布,并计算出统计量的数值. 选定显著性水平,确定临界值应在抽样之前就确定下来,根据单、双侧检验的情况,将放置一侧或双侧.然后根据第二步骤中所选择统计量服从的分布,查相应分布表,确定临界值. 进行判别,得出结论将第二步计算的数值与第三步得到的临界值进行比较,根据判别原则,作出结论.2.2.2 最大似然估计及拟合优度检验最大似然估计中采样需满足一个很重要的假设,就是所有的采样都是独立同分布的.下面我们具体描述一下
7、最大似然估计:首先,假设为独立同分布的样本,为模型参数,f为我们所使用的模型,遵循我们上述的独立同分布假设.参数为的模型f产生上述样本可表示为在上面的假定模型且参数是未知的基础上,这时,我们已知的有,未知的有,所以似然函数定义为:,称为样本的似然函数.倘若存在一个值,使得在时有则称是的一个极大似然估计值,简记为MLE.在实际应用中通常采用的是两边取对数,得到公式如下:,由于是的单调增函数,因此,使对数似然函数达到最大与达到最大是等价的.令,即可解出的极大似然估计值.若总体是具有参数的泊松分布,为来自总体X的一个样本,则似然函数为:,令,得如下方程:,从中解得:,又,于是参数的最大似然估计为:.
8、拟合优度的检验,是通过统计量来检验变量的实际分布是否与理论分布相同.所谓拟合优度,是指实际观察的频数与期望(理论)频数相似的程度.检验可以对各种假设的分布进行检验.在对各种分布进行检验时,应将各变量值做适当分类,使每一类别的期望频数大于等于5.在选定类别时,如果变量值是有限个,则可以将其每一个取值作为一个类别;如果变量值可以取无限个,则通过适当合并,将其变为有限个区间,把每一个区间视为一类.2.2.3 P值检验所谓P值,是指在一个假设检验问题中,利用观测值能够做出拒绝原假设选择的最小显著性水平,如果p值小于显著性水平,则相应的检验统计量的值落入拒绝域中.其检验规则为:若值,则拒绝原假设; 若值
9、,则接受原假设.2.2.4 Poisson分布检验设总体服从具有参数为的泊松分布,为其样本.考虑检验问题: ,现有其中因此则当为真时,统计量服从参数为的泊松分布,则在一般情况下上述方程不易求解,但当不接近于零而又不很小时,统计量的渐进分布为正态分布,则对一切实数都渐近地成立(这是因为正态分布具有对称性).因此,由下式确定:3 关于Poisson分布检验的三个案例及实际研究3.1 案例分析3.1.1 论反腐败与泊松分布 腐败现象作为当今社会的一种非常态,它的发生、出现引起了广大群众的关注.调查显示最近几年科级腐败正在加剧,小官受贿成隐患.据悉,某检察院工作人员对某经济较落后省的320个底层官员在
10、一年时间内的受贿金额调查纪录如下表所示.根据这些数据(金额0表示未受贿,金额1表示受贿金额大于0小于等于1,其余类同)检验受贿金额是否服从泊送分布. 表 2 1年内320个官员受贿金额(万元)统计表金额012345678910合计人数154770815225169410320来源于参考文献6用折线图像模拟数据如下:官员受贿频数图0204060801001234567891011受贿金额人数系列1 图2 从图形走势看,为左偏凸值分布,与泊松分布较为相似,可初步判定为泊松分布.在理论上,这里我们需要检验的是在一年的时间段内受贿官员的受贿金额是否服从泊送分布,所以可以假设 :一年的时间内受贿官员的受
11、贿金额服从泊送分布; : 一年的时间内受贿官员的受贿金额不服从泊送分布;我们知道泊送分布的概率密度函数为 ,式中:是未知参数.如果假设为真时,可以根据本数据估计.由上表的数据可以的到在320个底层官员中,平均每一官员受贿的金额(万元),即因此,可以用作为的估计值,即得到为真时的概率密度函数根据该密度函数,就可以计算出在每一个官员的受贿金额为各个类别出现的概率,这些概率值可通过泊送分布表查得.例如,在一年内受贿金额为0万元的官员人数的概率是,受贿金额为1万元的概率是等.然后用查出的概率分别乘以样本容量,就可以得到各类别期望的频数.例如,在320个官员中受贿金额为0万元的期望频数是.下表列出了统计
12、量的计算过程. 表 3 统计量的计算过程受贿金额 为真时的实际频数 期望频数012345678910万元以上0.04980.14940.22400.22400.16800.10080.05040.02160.00810.00270.001215477081522516941015.93647.80871.6871.6853.7632.25616.1286.9122.5920.8640.3840.05500.01370.03941.21180.05761.63221.01590.9812合计1.00003203205.0068我们注意到表中,受贿金额为8,9和10万元次及以上金额的期望频数都小于
13、5,所以将这三类归于受贿金额为7万元的合并为一类,所以合并之后的类别数.这时统计量为需要注意的是:根据Pearson定理,上式的统计量服从自由度为的分布,其中时类别的个数,是估计的总体参数的个数.在这里(只估计了一个参数),所以自由度为.于是,当时,查表可得.对于样本的值,因为落在接受域中.所以接受,拒绝,即在一年的时间中该地区官员的受贿金额是服从泊松分布的.大家熟知当n很大,p很小时的二项分布趋于泊松分布.按照泊松分布的规律,一项非正常态现象的出现除了在总体中的概率很小外,其最明显的特征则是常常集中分布.通过上面检验和大量案例表明,腐败现象作为社会现象中的一种非正常态,其发生和发展呈泊松分布
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 关于 Poisson 分布 检验
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【a199****6536】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【a199****6536】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。