第五章总体参数估计.doc
《第五章总体参数估计.doc》由会员分享,可在线阅读,更多相关《第五章总体参数估计.doc(29页珍藏版)》请在咨信网上搜索。
1、第五章 参数估计一、单一总体的参数估计(一)估计的含义 估计:人人都做过。如: 上课时,你会估计一下老师提问你的概率有多大? 当你去公司应聘时,会估计你被录用的可能性是多少? 推销员年初时要估计今年超额完成任务的概率有多大?估计量:用来估计总体参数的样本统计量。如:算术平均数、中位数、标准差、方差等。估计的可能性与科学性:数理统计证明,一个“优良”的样本统计量应具备以下特征:(1)、无偏性。样本估计量的期望值应等于总体参数。无系统偏差。(2)、有效性。与离散度相联系。在多个无偏估计量中,方差最小的估计量最有效。(3)、一致性。随着样本容量的增加,可以使估计量越来越靠近总体参数。(4)、充分性。
2、估计量能够充分利用有关信息,中位数和众数不具备这一点.估计的类型包括 :1、 点估计:只有一个取值。如样本平均数 就是总体平均数的点估计值。2、区间估计:给出取值范围(值域).见PPT 两种估计类型哪一种更科学? 区间估计的优点在于:它在给出估计区间时,还可以给予一个“可信程度”.例如:销售经理想估计一下明年的出口总值,甲估计是53万美元,乙估计是5056万美元之间,并可以确切地说“有95%的把握”。显然后者的可信程度大于前者。那么,50-56万美元之间的范围是如何计算的?“有95%的把握”是什么意思?【引例】:某食品进出口公司向东南亚出口一批花生制品,管理人员从中抽取50包作为样本,计算其平
3、均数为250克。另外,合同规定总体标准差为6克。如果问这批花生制品的平均重量,可用样本平均数作为总体平均数的最佳估计量:250克。但这是远远不够的,在许多时候,管理人员还想了解“这个估计值的平均误差是多少?”“总体平均数可能落入样本平均数上、下多大范围内?”“ 这个估计值的可靠程度是多少?”1由于n=50,根据中心极限定理可作图: n=50,=62抽样平均误差:3若用250克这个估计值估计总体平均数,其平均误差为0.8487。 4若用区间表示估计的值域:这批花生制品的总体平均重量是2500。8487克之间。5总体平均数在2500。8487克之间的可信度为68.3%。总体平均数在25020。84
4、87克之间的可信度为95.5%。总体平均数在25030。8487克之间的可信度为99.7。(二)区间估计中几个常用概念1、置信度(置信系数):它是指与一个估计区间相联系的概率,它表示该区间将包括总体参数的可能程度.用1表示.置信度越大,估计区间内所包含总体参数的可信度越高。(68.3、95。45、99.7都是置信度)2、置信区间:与一个“置信度”相联系的估计值的取值范围。用表示(如2502)2502:表示有95。45%的样本平均数构造的区间将包含总体平均数。2503:表示有99.73%的样本平均数构造的区间将包含总体平均数。3、置信限:与置信区间相联系的界限,包括上限和下限。如上题中下限:25
5、0,上限:250+思考题:置信度与置信区间有何关系?(三)总体平均数的区间估计1、大样本条件下的区间估计(1)、总体标准差已知条件下,对总体平均数的区间估计案例1:在【引例】中:食品进出口公司出口一批花生制品,管理人员抽取50包为样本,其平均数为250克。合同规定总体标准差为6克。问:(1)如果置信区间为:2502、2501。96,总体参数这一范围的把握程度有多大?(2)若用90的置信系数,则该批食品平均重量是多少? 解:(1)a、25020.8487,与z=2对应的置信度是:0.47722=95。44;b、2501。960.8487,与z=1。96对应的置信度是:0。47502=95。(2)
6、 与90%对应的Z值是0。9/2=0。45,Z=(1.64+1。65)/2=1.645,置信区间:2501.6450.8487,即该批食品的平均重量在248。6-251。396克之间的把握程度是90%。案例2:某茶叶进出口公司,准备处理一批库存2年的茶叶,出库之前要进行一次检验。检验数据如下;样本容量为64包,样本平均数为每包2公斤,入库记录表明总体标准差为0。2公斤。经理要求在95%的可信度下,估计一下这批茶叶的平均重量在多大范围内?解:答:这批茶叶平均重量在1。9512。049公斤,其可信程度为95%。课堂练习教材P144,1、2(2)、总体标准差未知条件下的区间估计总体标准差未知条件下,
7、一般用样本标准差S代替总体标准差.案例:某项抽样调查中获得如下资料: N可以视为无限总体,n=81,样本平均数为500,样本标准差为90,求:总体平均数可信度为90的置信区间.解:答:此项调查中,总体平均数的可信度为90的置信区间是在483.55516.45之间。习题1:一次等级考试,因急于评估试题质量,教师先随机抽取36份试卷批改,平均分是72分,标准差13。2分,系主任要求在90的可信度下,对全体考生的平均成绩做一个区间估计。解:习题2:某土产畜产公司收购一批烟草,抽取30箱为样本,平均重量为20公斤,标准差为3公斤.求:(1)置信度为95%时,这批烟草的平均重量;(2)置信度为80%时,
8、这批烟草的平均重量。解:(1) (2) 课后作业:教材P145,32、小样本条件下的区间估计 使用t分布的条件:当样本容量n30,且总体标准差未知时,用样本标准差S代替总体标准差。样本标准差S计算公式:例1:从大学一年级学生中随机抽取12名学生,其阅读能力得分为28,32,36,22,34,30,33,25,31,33,29,26.试评估一下大学一年级学生阅读能力的总体平均分数。要求置信度分别是95%和99%。解:步骤:(1)计算样本平均数: (2)计算样本标准差: (3)计算平均误差:(4)确认自由度:df=121=11,误差概率:=10。95=0.05/2=0。025,查表,t=2.201
9、 (5)估计总体平均数置信区间:解释:有95的把握程度说大学一年级学生阅读能力平均分数在27。311-32。523分之间。当=1-0.99=0。01/2=0.005,查表,t=3。105829。917-3。10581.184=26。24;29。917+3。10581。184=33.59。习题2:一批出口商品出库之前从中抽取14箱,其平均重量为40。5公斤,标准差0。5公斤。主管人员要求在98%的置信系数下,对这批商品的平均重量做个区间估计.置信系数为98%时,这批商品的平均重量是40。146-40。584公斤。习题3:某公司共有技术开发和中层管理人员600名,公司十分关心他们的身体健康现状,责
10、成有关部门进行了一次睡眠状况抽样调查,获得资料如下表: (单位:小时)员工每周睡眠 员工 每周睡眠 员工 每周睡眠 员工 每周睡眠序号 时间 序号 时间 序号 时间 序号 时间1 50 6 48 11 54 16 502 40 7 47 12 56 17 51 3 30 8 45 13 50 18 474 38 9 43 14 48 19 485 42 10 47 15 48 20 54 试以95%的置信系数对600名技术开发和中层管理人员平均每周的睡眠状况作一个区间估计.解:课堂练习:教材P145,4、5 小样本比例的区间估计可参照平均数的区间估计。 不同条件下总体平均数的区间估(P140)
11、总体分布样本容量已知未知正态分布大样本(n30)小样本(n30) 非正态分布大样本(n30)(四)、总体比率的区间估计 中心极限定理证明:P不接近0或1,且n很大时,其抽样分布趋近于正态分布。比例抽样分布的平均误差为: 总体比率的估计区间:是总体比率;P是样本比率。若未知,可用P.案例1:为适应清理整顿要求,某地审计局要对本地公司进行查账,主管负责人估计查账对象中有40的人会响应这一要求,如果向一个包括45个单位的随机样本寄去要求查账的通知单,审计局希望通过这一样本估计一下置信度为95时,包含总体实际比例的区间有多大。解:习题1:某西部人才咨询部门收到大批申请去西部工作的信函,人力资源管理部门
12、想了解被录用的比例,从中抽取500人,发现只有76人被录用。现要求使用95的可信度,对总体比例做一个区间估计。解:习题2:某私营企业为提高业务人员的业务能力,在拟订一项培训计划之前,对一个由300名员工组成的随机样本进行测试,结果发现参加测试人员中只有75人达到要求。主管人员要求在置信度为99的条件下,作一个区间估计。解:习题3:为了研究我国真丝制品的销路,在纽约举办的我国纺织品展销会上,对1000名成人进行了抽样调查,其中有600人我国的喜欢真丝制品。试以95的置信系数确定纽约市民成人喜欢真丝制品的比率的置信区间。课堂练习:教材P145,6、7(1)二、两个总体的参数估计(一)什么是来自两个
13、总体的独立样本?案例:假定某零售集团公司有两个连锁超市:一个位于市中心闹市区,另一个位于市郊的居民小区。销售经理发现,在其中一个超市畅销的W商品在另一超市却可能滞销。销售经理认为出现这种情况的原因,主要在于这两个地区的消费者群体的自身差异。例如包括消费者群体的可支配收入差异、受教育程度差异、年龄差异、以及工作性质等方面的差异。因此,销售经理想估计一下两个超市的消费者群体的平均可支配收入差异有多大.设总体A:为位于市郊居民小区的消费者群体;设总体B:为位于市中心闹市区的消费者群体;A总体A的平均数(指市郊居民小区消费者群体的人均可支配收入)B总体B的平均数(指市中心闹市区消费者群体的人均可支配收
14、入)于是,这两个不同总体的平均数之差可以表示为:AB为了估计这两个不同总体的平均数之差AB,现在从总体A中抽取一个简单随机样本n1,从总体B中抽取另一个简单随机样本n2。由于这两个简单随机样本都是独立抽取的,因此我们称其为“独立简单随机样本”,简称“独立样本。由两个独立样本分别计算出两个样本平均数为:1:n1名市郊居民小区消费者群体的人均可支配收入2:n2名市中心闹市区消费者群体的人均可支配收入因为是A的点估计值,是B的点估计值,因此,两个总体平均数之差的点估计值表示为: 12 假定根据上述两个独立随机样本计算的有关数据如下表:连锁超市随机样本个数人均可支配收入样本标准差市郊居民小区A市中心闹
15、市区B648112100元21800元S1950元 S2780元将上述数据代入公式求得两个总体平均可支配收入之差的一个点估计值为:1221001800 = 300(元)(二)两个总体均值之差的估计:独立样本1、12抽样分布的性质与区间估计在上例中,两个总体平均可支配收入之差为300元是唯一的吗?显然不是,是随机的。因为两个样本都是随机的,正如所有的点估计值一样,300元之差也只是两个总体平均可支配收入之差的很多可能的点估计值中的其中之一。假如选择了另外一个由64位市中心闹市区消费者,和另外一个由81位市郊居民小区消费者构成的两个随机样本,这两个样本平均数之差就完全有可能不等于300元。由此可见
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第五 总体 参数估计
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【快乐****生活】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【快乐****生活】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。