测量信度与随机误差控制.pptx
《测量信度与随机误差控制.pptx》由会员分享,可在线阅读,更多相关《测量信度与随机误差控制.pptx(61页珍藏版)》请在咨信网上搜索。
1、第二章第二章 测量信度与测量信度与 随机误差控制随机误差控制江西师范大学江西师范大学 心理与教育统计测量中心心理与教育统计测量中心 学习目标:学习目标:1.什么是信度什么是信度?信度与测量随机误差的关系?信度与测量随机误差的关系?2.信度的统计定义?信度的统计定义?3.描述信度的指标有哪些?描述信度的指标有哪些?4.分析测验信度应注意哪些问题?分析测验信度应注意哪些问题?5.信度的标准与作用?信度的标准与作用?6.经典测量理论信度系数的估计方法。经典测量理论信度系数的估计方法。7.提高测量信度的主要方法有哪些?提高测量信度的主要方法有哪些?第一节第一节 信度概述信度概述解答本章学习目标中的第解
2、答本章学习目标中的第1-5个目标。个目标。一、信度与测量误差一、信度与测量误差1.经典测量理论的假设经典测量理论的假设 式中,式中,X为观察分数,为观察分数,T为一般真分数,为一般真分数,E为随机为随机误差分数,误差分数,V为目标真分数,为目标真分数,I为非目标真分数(系为非目标真分数(系统误差)。统误差)。第一节第一节 信度的概述信度的概述一、信度与测量误差一、信度与测量误差2.信度的定义信度的定义测量追求的初步目标:测量追求的初步目标:T占占X的比例越大越好。的比例越大越好。测量追求的终极目标:测量追求的终极目标:V占占X的比例越大越好。的比例越大越好。第一节第一节 信度的概述信度的概述
3、当当T占占X的比例很大时,那么测值就会是稳定的。一的比例很大时,那么测值就会是稳定的。一般来说,稳定的测值是可靠的、可信的,因此,信度般来说,稳定的测值是可靠的、可信的,因此,信度可被认为是测量结果的可被认为是测量结果的稳定性程度稳定性程度。一、信度与测量误差一、信度与测量误差2.信度的定义信度的定义第一节第一节 信度的概述信度的概述v信度(信度(reliability)是指在不同时间,使用同一测验,)是指在不同时间,使用同一测验,或者使用两个不同项目的等值测验,抑或在其他不同或者使用两个不同项目的等值测验,抑或在其他不同的测试条件下,对同一组被试实施两次或多次测试所的测试条件下,对同一组被试
4、实施两次或多次测试所得分数的一致性。得分数的一致性。v测验信度表示测验分数中个体差异可归因于所测特测验信度表示测验分数中个体差异可归因于所测特质中质中“真实真实”差异的程度,以及可归因于随机误差的差异的程度,以及可归因于随机误差的程度。程度。二、信度的统计定义二、信度的统计定义1.经典测量理论假设的推论经典测量理论假设的推论第一节第一节 信度的概述信度的概述二、信度的统计定义二、信度的统计定义2.信度的统计定义信度的统计定义定义定义1:信度是被试团体真分数方差与实得分数方差之比:信度是被试团体真分数方差与实得分数方差之比定义定义2:信度是被试团体真分数与实得分数相关系数的平方:信度是被试团体真
5、分数与实得分数相关系数的平方定义定义3:信度是一个测验:信度是一个测验X(A卷)与它的任意一个平行测验卷)与它的任意一个平行测验(B卷)的相关系数卷)的相关系数第一节第一节 信度的概述信度的概述三、描述信度的指标三、描述信度的指标1.经典测量理论的信度系数经典测量理论的信度系数信度系数是表示测量结果的稳定性程度的指标。信度系数是表示测量结果的稳定性程度的指标。记为:记为:第一节第一节 信度的概述信度的概述信度系数的值域:信度系数的值域:0,1没有百分之百可靠的测量,因此,没有百分之百可靠的测量,因此,rXX=1只是理论只是理论上的值,实际当中是不会存在的。上的值,实际当中是不会存在的。?相关系
6、数的值域是相关系数的值域是-1,+1,信度系数的值域:,信度系数的值域:0,1,为什么?,为什么?三、描述信度的指标三、描述信度的指标1.经典测量理论的信度系数经典测量理论的信度系数(1)重测信度重测信度(test-retest coefficients),是指用同一个量表),是指用同一个量表对同一组被试施测两次所得结果的一致性程度,其大小等于对同一组被试施测两次所得结果的一致性程度,其大小等于同一组被试在两次测验上所得分数的相关系数。同一组被试在两次测验上所得分数的相关系数。(2)复本信度复本信度(alternative-form coefficients),是指两个),是指两个平行的测验测
7、量同一批被试所得结果的一致性程度,其大小平行的测验测量同一批被试所得结果的一致性程度,其大小等于同一批被试在两个复本测验上所得分数的相关系数。等于同一批被试在两个复本测验上所得分数的相关系数。(3)内部一致性系数内部一致性系数(internal consistency coefficients)也)也叫叫同质性信度同质性信度(homogeneity reliability),是指测验内部所有),是指测验内部所有题目间的一致性程度,主要的计算方法有题目间的一致性程度,主要的计算方法有KR20公式、公式、KR21公公式、克龙巴赫式、克龙巴赫系数,以及荷伊特信度等系数,以及荷伊特信度等。第一节第一节
8、 信度的概述信度的概述三、描述信度的指标三、描述信度的指标2.经典测量理论的测量标准误经典测量理论的测量标准误 测量标准误差测量标准误差(standard error of measurement)是测量误差的假设分布的标准差。用)是测量误差的假设分布的标准差。用下列公式能够容易地计算测量标准误差:下列公式能够容易地计算测量标准误差:第一节第一节 信度的概述信度的概述式中,式中,SDt表示测验分数的标准差,表示测验分数的标准差,rXX表示信度系数。表示信度系数。3.概化理论概化理论的概化系数(的概化系数(generaliability coefficients)4.IRT的测验信息函数的测验信
9、息函数(test information function)四、分析测验信度应注意的问题四、分析测验信度应注意的问题1.针对测验类型选用恰当指标针对测验类型选用恰当指标(1)传统的信度概念适合于)传统的信度概念适合于常模参照测验常模参照测验,这种,这种测验的主要目的是为了区分个体在特定特征上所表测验的主要目的是为了区分个体在特定特征上所表现出的差异性。个体在测验分数中表现出的差异范现出的差异性。个体在测验分数中表现出的差异范围越大,该测验的信度也就越高。围越大,该测验的信度也就越高。第一节第一节 信度的概述信度的概述四、分析测验信度应注意的问题四、分析测验信度应注意的问题1.针对测验类型选用恰
10、当指标针对测验类型选用恰当指标(2)标准参照测验(内容参照或领域参照测验)标准参照测验(内容参照或领域参照测验)的目标是要的目标是要确定被试是否达到或未达到某个标准,从而将个体分到不同的确定被试是否达到或未达到某个标准,从而将个体分到不同的组别:组别:“达标达标”和和“未达标未达标”。这种情况下,传统的重测信度、。这种情况下,传统的重测信度、复本信度以及内部一致性系数就不再适用。标准参照测验可根复本信度以及内部一致性系数就不再适用。标准参照测验可根据具体情况分别采用如下指标:据具体情况分别采用如下指标:适用于简单的掌握与否的两分决策,即所有的分类误差适用于简单的掌握与否的两分决策,即所有的分类
11、误差都被认为同样严重而不管它们离开临界分数的距离。在都被认为同样严重而不管它们离开临界分数的距离。在这种情况下,可以使用平行型式进行再测,以便得出在这种情况下,可以使用平行型式进行再测,以便得出在两次测验上得到相同决策的个体的百分比,进一步可算两次测验上得到相同决策的个体的百分比,进一步可算得得分类一致性系数分类一致性系数(coefficient of agreement)。)。第一节第一节 信度的概述信度的概述四、分析测验信度应注意的问题四、分析测验信度应注意的问题1.针对测验类型选用恰当指标针对测验类型选用恰当指标不仅仅关心对掌握者和未掌握者的质的区分,同时也在不仅仅关心对掌握者和未掌握者
12、的质的区分,同时也在分数连续体上描述了关于掌握和未掌握的量的差异。这分数连续体上描述了关于掌握和未掌握的量的差异。这类信度主要采用类信度主要采用K2(X,T)指标:指标:第一节第一节 信度的概述信度的概述式中,式中,、分别为被试总体在测验上的真分数方差和观分别为被试总体在测验上的真分数方差和观测分数方差;测分数方差;、分别为真分数和观测分数的平均值;分别为真分数和观测分数的平均值;ng为测验题目数,为测验题目数,c是以做对题目百分比表示的区分标准。是以做对题目百分比表示的区分标准。四、分析测验信度应注意的问题四、分析测验信度应注意的问题1.针对测验类型选用恰当指标针对测验类型选用恰当指标K2(
13、X,T)值越大,说明观测分与区分标准分数(划界分数)值越大,说明观测分与区分标准分数(划界分数)之间的差异代表真分数的对应差异量的可能性越大,因之间的差异代表真分数的对应差异量的可能性越大,因而观测分与划界分数的差异就越能反映真实能力上的差而观测分与划界分数的差异就越能反映真实能力上的差异。换言之,测验就更可信。异。换言之,测验就更可信。就单个测验的结果而言,就单个测验的结果而言,K2(X,T)的计算公式如下:的计算公式如下:第一节第一节 信度的概述信度的概述式中,是由库德理查德式中,是由库德理查德KR20公式求出的信度系数,其公式求出的信度系数,其余符号意义同前。余符号意义同前。四、分析测验
14、信度应注意的问题四、分析测验信度应注意的问题1.针对测验类型选用恰当指标针对测验类型选用恰当指标(3)在在纯速度测验(纯速度测验(speed test)中,个体差异完全取中,个体差异完全取决于速度,此时,就无法恰当地解释施测一次测验的决于速度,此时,就无法恰当地解释施测一次测验的信度系数。信度系数。如果条件许可,可采用如果条件许可,可采用重测法重测法或是或是复本法复本法,这是比较合,这是比较合适的。适的。分半法分半法也可以使用,但是此时的分半是按时间分半,而也可以使用,但是此时的分半是按时间分半,而不是按照项目来分半。也就是,两半分数必须根据分别不是按照项目来分半。也就是,两半分数必须根据分别
15、规定时间的两个半测验。例如,可以把奇偶项目分别印规定时间的两个半测验。例如,可以把奇偶项目分别印制在两张卷上,每组项目的用时为全测验的一半。这种制在两张卷上,每组项目的用时为全测验的一半。这种方法等于在同一时间实施了两个等值测验。方法等于在同一时间实施了两个等值测验。第一节第一节 信度的概述信度的概述四、分析测验信度应注意的问题四、分析测验信度应注意的问题1.针对测验类型选用恰当指标针对测验类型选用恰当指标还有一种替代实施两个半测验的方法,就是把还有一种替代实施两个半测验的方法,就是把总时间四总时间四等分等分,算出每段时间的分数。这种方法简便易行,施测,算出每段时间的分数。这种方法简便易行,施
16、测时每当主试发出事先安排的信号,就要测验参加进在他时每当主试发出事先安排的信号,就要测验参加进在他们正在做的项目上打个记号。然后,把第一段和第四段们正在做的项目上打个记号。然后,把第一段和第四段时间内答对的项目数相加,得出一个半测验分数;把第时间内答对的项目数相加,得出一个半测验分数;把第二段和第三段时间内答对的项目数相加,得出另一个半二段和第三段时间内答对的项目数相加,得出另一个半测验分数。四段时间如此相加,往往可以平衡练习、疲测验分数。四段时间如此相加,往往可以平衡练习、疲劳和其他因素的累积效应。特别是当项目难度水平前后劳和其他因素的累积效应。特别是当项目难度水平前后一致,而不是逐渐增加时
17、,这种方法尤其令人满意。一致,而不是逐渐增加时,这种方法尤其令人满意。第一节第一节 信度的概述信度的概述四、分析测验信度应注意的问题四、分析测验信度应注意的问题2.信度的报告信度的报告(1)任何一个信度系数是针对引起测验误差的特定因任何一个信度系数是针对引起测验误差的特定因素而言的。有多少种影响测验分数的条件,就有多少素而言的。有多少种影响测验分数的条件,就有多少种测验信度,因此,报告信度时,应该详细说明测试种测验信度,因此,报告信度时,应该详细说明测试样本的特性和所报告的信度类型。样本的特性和所报告的信度类型。在信度报告时只是报告信度系数,而缺乏说明估在信度报告时只是报告信度系数,而缺乏说明
18、估算系数的方法细节,推导系数时所用的被试群体的特算系数的方法细节,推导系数时所用的被试群体的特征,以及获取数据当时的施测条件,等等,这种信度征,以及获取数据当时的施测条件,等等,这种信度报告是不合格的。报告是不合格的。第一节第一节 信度的概述信度的概述四、分析测验信度应注意的问题四、分析测验信度应注意的问题2.信度的报告信度的报告(2)没有一个单一的、最优的方法来量化信度,没有没有一个单一的、最优的方法来量化信度,没有一个单独的指数能恰当地表达所有的相关事实,没有一个单独的指数能恰当地表达所有的相关事实,没有一个单独的研究方法在所有的情形下都是最佳选择,一个单独的研究方法在所有的情形下都是最佳
19、选择,且测验编制者也不应局限于将某一种方法运用到任何且测验编制者也不应局限于将某一种方法运用到任何一种测量手段上去。所以,测验编制者在报告测验信一种测量手段上去。所以,测验编制者在报告测验信度时,可以从多方面予以报告。度时,可以从多方面予以报告。第一节第一节 信度的概述信度的概述四、分析测验信度应注意的问题四、分析测验信度应注意的问题2.信度的报告信度的报告(3)提供详细的信度分析报告,让了解相关知识的人提供详细的信度分析报告,让了解相关知识的人能够对结果进行评定,并能够重复信度分析的过程。能够对结果进行评定,并能够重复信度分析的过程。例如,简单说一句例如,简单说一句“某测验的信度是某测验的信
20、度是0.92”是不能是不能接受的。较恰当的说法是接受的。较恰当的说法是“某测验的信度系数为某测验的信度系数为0.92,该数值是通过计算一份能力测验间隔两周两次测试,该数值是通过计算一份能力测验间隔两周两次测试成绩的相关系数得出的。数据来源是从某市随机抽取成绩的相关系数得出的。数据来源是从某市随机抽取的的500名小学名小学5年级的学生施测年级的学生施测”。第一节第一节 信度的概述信度的概述五、信度的标准与作用五、信度的标准与作用1.信度是评价测验质量的重要指标之一。信度是评价测验质量的重要指标之一。测验类型测验类型 信度系数信度系数 低低中中高高学业成就测验学业成就测验0.660.920.98学
21、术能力测验学术能力测验0.560.900.97特殊能力倾向测验特殊能力倾向测验0.260.880.96人格测验人格测验0.460.850.97兴趣测验兴趣测验0.420.840.93态度测验态度测验0.470.790.98注:表中数据来源,Lewis R.Aiken:Psychological testing and assessment(eighth edition),Allyn and Bacon,Inc,1994.第一节第一节 信度的概述信度的概述五、信度的标准与作用五、信度的标准与作用2.信度是测量过程中所存在的随机误差大小的反映。信度是测量过程中所存在的随机误差大小的反映。第一节第一
22、节 信度的概述信度的概述 例如,我们已知高考文科试卷的总信度例如,我们已知高考文科试卷的总信度rXX=0.965,文科,文科考生总分的标准差为考生总分的标准差为53.42,那么,文科考试成绩的标准误为:那么,文科考试成绩的标准误为:3.信度可以用来解释个人测验分数的意义信度可以用来解释个人测验分数的意义测量测量标准误。标准误。如果某生的考试成绩为如果某生的考试成绩为495分,在置信度为分,在置信度为0.95时,其真时,其真分数的置信区间为:分数的置信区间为:五、信度的标准与作用五、信度的标准与作用4.信度可以帮助进行不同测验分数的比较。信度可以帮助进行不同测验分数的比较。第一节第一节 信度的概
23、述信度的概述考察两个分数的差异是否可靠,是否真有差异的问题。比如,考察两个分数的差异是否可靠,是否真有差异的问题。比如,某人的物理成绩是否真的优于化学?某人的数学技能本学期某人的物理成绩是否真的优于化学?某人的数学技能本学期是否真有进步?某人在韦氏智力量表上操作智商与言语智商是否真有进步?某人在韦氏智力量表上操作智商与言语智商的差异是否真有显著意义等。的差异是否真有显著意义等。当两测验的方差相等时,差异分数的信度系数可用如下公当两测验的方差相等时,差异分数的信度系数可用如下公式求出式求出:式中,式中,rXXdiff是差异分数的信度系数;是差异分数的信度系数;rXX和和rYY是两个测是两个测验各
24、自的信度系数;验各自的信度系数;rXY是两测验间的相关系数。是两测验间的相关系数。五、信度的标准与作用五、信度的标准与作用4.信度可以帮助进行不同测验分数的比较。信度可以帮助进行不同测验分数的比较。第一节第一节 信度的概述信度的概述差异分数的测量标准误可用如下公式求出:差异分数的测量标准误可用如下公式求出:式中,式中,SEdiff是差异分数的测量标准误;是差异分数的测量标准误;rXX和和rYY是两个是两个测验各自的信度系数;测验各自的信度系数;SD是两测验间使用的相同的标准是两测验间使用的相同的标准差。在比较分数之前,必须将两个测验分数转为具有相差。在比较分数之前,必须将两个测验分数转为具有相
25、同量表的标准分数。同量表的标准分数。五、信度的标准与作用五、信度的标准与作用4.信度可以帮助进行不同测验分数的比较。信度可以帮助进行不同测验分数的比较。第一节第一节 信度的概述信度的概述例如,在韦氏成人智力量表中,言语和操作分测验的信度为例如,在韦氏成人智力量表中,言语和操作分测验的信度为 0.97和和0.93,而它们的智商的平均数为,而它们的智商的平均数为100,标准差为标准差为15,故故言语和操作智商差数的标准误为:言语和操作智商差数的标准误为:因为因为4.741.969.29,因此,言语和操作智商相差因此,言语和操作智商相差10分时,分时,在在0.05水平上,我们说存在显著差异。若要在水
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 测量 信度 随机误差 控制
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【精****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【精****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。