1.2《独立性检验基本思想及其初步应用》.doc
《1.2《独立性检验基本思想及其初步应用》.doc》由会员分享,可在线阅读,更多相关《1.2《独立性检验基本思想及其初步应用》.doc(21页珍藏版)》请在咨信网上搜索。
1、12独立性检验的基本思想及其初步应用1分类变量的定义如果某种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量222列联表一般地,假设有两个分类变量X和Y,它们的取值分别为x1,x2和y1,y2,其样本频数列联表(称为22列联表)为:y1y2总计x1ababx2cdcd总计acbdabcd3.独立性检验.,1下列变量中不属于分类变量的是(B)A性别B吸烟C宗教信仰 D国籍解析:“吸烟”不是分类变量,“是否吸烟”才是分类变量故选B.2下面是一个22列联表y1y2合计x1a2173x222527合计b46100则表中a、b的值分别为(C)A94、96 B52、50C52、54 D54
2、、52解析:由a2173,得a52,由b46100,得b54.3某高校“统计初步”课程的教师随机调查了选修该课程的一些学生情况,具体数据如下表:为了判断主修统计专业是否与性别有关系,根据表中的数据,得到K24.8443.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为_解析:P(K23.841)0.05,判断出错的可能性为5%.答案:5%通过案例理解分类变量、列联表、独立性检验的含义,利用列联表的独立性检验进行估计独立性检验的基本思想,随机变量K2的含义(1)直观分析的两种方法频率分析通过对样本的每个分类变量的不同类别和事件发生的频率的大小比较来分析变量之间是否有关系,通常
3、通过列联表列出两个分类变量进行分析一般地,假设有两个分类变量X和Y,它们的取值分别为x1,x2和y1,y2,其样本频数列联表(称为22列联表)为:yxy1y2总计x1ababx2cdcd总计acbdabcd在列联表中,如果两个分类变量没有关系,则应该满足adbc0.因此|adbc|越小,说明两个分量之间的关系越弱;|adbc|越大,说明两个分类变量之间的关系越强图形分析利用等高条形图来分析两分类变量之间是否具有相关关系,形象、直观地反映两个分类变量之间的总体状态和差异大小,进而推断它们之间是否有关系a绘制等高条形图时,列联表的行对应的是高度,两行的数据不相等,但对应的条形图的高度是相同的,两列
4、的数据对应不同颜色b.等高条形图中有两个高度相同的矩形,每一个矩形中都有两种颜色,观察下方颜色区域的高度,如果两个高度相差比较明显,就判断两个分类变量之间有关系(2)独立性检验及其基本思想独立性检验利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验利用上诉公式求出K2的观测值为k.再得出X与Y有关系的程度,通常用到以下数据:(i)如果k6.635,在犯错误的概率不超过0.01的前提下认为X与Y有关系;(ii)如果k2.706,在犯错误的概率不超过0.1的前提下认为X与Y有关系;值得注意的是:观察值k越大,越有利于结论“X和Y有关系”,越小越有利于
5、结论“X和Y没有关系”因此,可以建立一定的规则:当kk0时就说X与Y有关系,kk0时就说X和Y没有关系,故求得观测值后只要与建立的规则进行比较即可得出结论独立性检验的基本思想独立性检验的基本思想是要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设该结论不成立,即假设“两个分类变量没有关系”成立,在该假设下我们构造的随机变量K2应该很小,如果由观察数据计算得到K2的观测值k很大,则在一定程度上说明假设不合理,根据随机变量K2的含义,可以通过P(k6.635)0.01来评价假设不合理的程度,由实际计算出k6.635,说明假设不合理的程度约为99%,即两个分类变量有关系这一结论成立的可信度
6、为99%,不合理的程度可查下表得出:1独立性检验是对两个分类变量间是否有关系的一种案例分析方法,其分析方法有:等高条形图法和利用假设的思想方法,计算出某一个随机变量K2的观测值来进行判断2在等高条形图中,可以估计满足条件Xx1的个体中具有Yy1的个体所占的比例为,也可以估计满足条件Xx2的个体中具有Yy2的个体所占的比例为,两个比例的值相差越大,两个分类变量相关的可能性就越大3独立性检验的一般步骤:(1)根据样本数据制成22列联表;(2)根据公式K2计算K2的观测值;(3)比较K2与临界值的大小关系作统计推断1在等高条形图形中,下列哪两个比值相差越大,“两个分类变量有关系”成立的可能性越大(C
7、)A.与 B.与C.与 D.与2通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表;男女合计爱好402060不爱好203050总计6050110由K2算得,K27.8.附表:P(F2k0)0.0500.0100.001k03.8416.63510.828参照附表,得到的正确结论是(A)A有99%以上的把握认为“爱好该项运动与性别有关”B有99%以上的把握认为“爱好该项运动与性别无关”C在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”3某高校“统计初步”课程的教师随机调查了选该课的一些学
8、生的情况,具体数据如下表:专业性别非统计专业统计专业男1310女720为了判断主修统计专业是否与性别有关系,根据表中数据得到,k4.844,因为k3.841,所以确定主修统计专业与性别有关系,那么这种判断出错的可能性为_解析:k4.8443.841,有95%的把握可以确定主修统计专业与性别有关,那么这种判断出错的可能性为5%.答案:5%1在研究两个分类变量之间是否有关系时,可以粗略地判断两个分类变量是否有关的是(B)A散点图 B等高条形图C22列联表 D以上均不对2对分类变量X与Y的随机变量K2的观测值k,说法正确的是(B)Ak越大,“X与Y有关系”可信程度越小Bk越小,“X与Y有关系”可信程
9、度越小Ck越接近0,“X与Y无关”程度越小Dk越大,“X与Y无关”程度越大3下面是一个22列联表:y1y2总计x1522173x22ab总计5446100则表中a、b的值分别是(C)A94、96 B25、21C25、27 D27、254分类变量x和y的列联表如下,则(C)y1y2总计x1ababx2cdcd总计acbdabcdA.adbc越小,说明x与y的关系越弱Badbc越大,说明x与y的关系越弱C(adbc)2越大,说明x与y的关系越强D(adbc)2越小,说明x与y的关系越强解析:由K2知,(adbc)2越大,K2值越大,说明x与y的关系越强5某班主任对全班50名学生进行了作业量多少的调
10、查,数据如下表:认为作业多认为作业不多总数喜欢玩电脑游戏18927不喜欢玩电脑游戏81523总数262450则认为喜欢玩电脑游戏与认为作业多少有关系的把握大约为(B)A99% B95%C90% D无充分依据解析:由表中数据计算K25.059,而K25.0593.841,所以约有95%的把握认为两变量之间有关6为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠,在照射后14天内的结果如下表所示:死亡存活合计第一种剂量141125第二种剂量61925合计203050进行统计分析时的统计假设是_解析:根据独立性检验的基本思想,可知其类似反证法,即要确认“两个分类变量有
11、关系”这一结论成立的可信程度,首先假设结论不成立,即假设结论“两个分类变量没有关系”成立,对本题,进行统计分析时的统计假设应是“小白鼠的死亡与剂量无关”答案:小白鼠的死亡与剂量无关7(2013韶关二模)以下四个命题中:在一次试卷分析中,从每个试室中抽取第5号考生的成绩进行统计,是简单随机抽样;样本数据3,4,5,6,7的方差为2;对于相关系数r。|r|越接近1,则线性相关程度越强;通过随机询问110名性别不同的行人,对过马路是愿意走斑马线还是愿意走人行天桥进行抽样调查,得到如下列联表:男女总计走天桥402060走斑马线203050总计6050110由K2可得,K27.8,则有99%以上的把握认
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 独立性检验基本思想及其初步应用 1.2 独立性 检验 基本 思想 及其 初步 应用
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【a199****6536】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【a199****6536】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。