一种改进的4参数等级反应模型和应用_曾光.pdf
《一种改进的4参数等级反应模型和应用_曾光.pdf》由会员分享,可在线阅读,更多相关《一种改进的4参数等级反应模型和应用_曾光.pdf(9页珍藏版)》请在咨信网上搜索。
1、第 卷 第 期 年 月江西师范大学学报(自然科学版)()收稿日期:基金项目:贵州省教育厅自然科学基金(黔科教()号)资助项目通信作者:黎瑞源(),男,广西桂林人,副教授,博士,主要从事教育测评技术及应用研究:曾光,张玉玲,谢晓尧,等 一种改进的 参数等级反应模型和应用 江西师范大学学报(自然科学版),():,(),():文章编号:()一种改进的 参数等级反应模型和应用曾 光,张玉玲,谢晓尧,黎瑞源(贵州师范大学贵州省信息与计算科学重点实验室,贵州 贵阳;贵阳市教育科学研究所,贵州 贵阳)摘要:针对在实际测验中各等级的猜测参数、失误参数可能存在不一致性问题,该文提出等级反应模型的改进模型 以 等
2、级项目为例,通过模拟数据检验模型发现:使用 参数 模型估计参数的误差随着猜测参数和失误参数的各个不一致性而增大,而改进后的模型具备更好的稳定性 在实际的地理测验中,发现等级反应项目中的猜测度较低,但失误现象明显,并且参数之间的差异性较大,不可以忽略关键词:项目反应理论;等级反应模型;参数 模型中图分类号:文献标志码:引言随着学科融合发展,开始被应用在临床医学、经济管理、体育等,不再局限于教育与心理测量中 并且现代蓬勃发展的统计学、计算机科学和数据科学进一步为 的发展注入活力,庞大的数据量与计算量不再是阻碍,估计精度有了明显提高 这些需求与条件促使研究者要根据实际情况选择适当的模型,或发展新的模
3、型 目前的项目反应理论模型已有 多种,需考虑什么样的模型更能拟合好实测数据近些年,国内研究者越来越关注心理测验中的,关于 的理论与应用研究相继取得一些研究成果 如刘玥等选取了来自心理测验和成就测验的实际数据,分别采用传统模型和 进行拟合,这说明 能够显著提高模型对心理测验和成就测验数据的拟合性 金英姿等同样在语言测验中发现一些项目确实存在睡眠现象,加入失误参数进行数据拟合非常必要 主要应用在 评分分项目中,然而在许多测评被试潜在特质的案例中,情况不仅限于被试样本回答了一组由一定数量的 评分项目组成的问卷,得到的结果也不只是一系列代表“正确”或“错误”的反应 如果需衡量某种仅出现在深度的思考过程
4、中的潜在特质,则需提前准备具有复杂推理过程的项目,根据被试在评分标准中所体现的目标的达成程度对项目进行评分,这类题目被称作多级评分题 提出的等级反应模型(,)在多级评分形式的测验中已被广泛使用传统 实质是在单、双参数 模型框架下建立的,但 的优势促使某些研究者对等级反应项目的猜测现象和失误现象进行研究 陈青等基于,在保持 的特性(项目等级难度递增)的条件下,将猜测参数融合到项目的整体参数中,即认为被试在完成多级评分试题的整个过程中,各个等级的猜测程度应该是不变的 之后,简小珠等同样将失误参数作为项目参数融合到 中,而猜测参数的概率均匀分配到各个项目特征函数中,用它们反映多级记分试题上的猜测现象
5、和失误现象,从而使得被试能力高估现象和低估现象得到了有效的纠正 作为一个减法模型,在参数估计时难以保证相减所导出的差为非负值 上述模型的每个项目只包含一个猜测参数或失误参数的约束,虽然保证了 概率必须非负的要求,也造成了当多级计分项目的等级参数不一致时难以拟合的困境 为了反映多级计分项目各等级的相对独立性和差异性,区别于各等级猜测参数、失误参数一致的模型(本文记为),探究等级参数的差异性,本文提出一种改进的 参数等级反应模型(本文记为)在坚持假设合理与继承等级模型的特性的原则下,保证概率必须非负的规定,为各等级赋予合理的等级参数,提高了模型的普适性和估计结果的准确性 模型介绍本文在 的基础上加
6、入不一致的猜测参数 和失误参数,提出了等级反应模型的改进模型原理如下:设存在一个有 个等级的项目,被试 的能力为,各个得分等级中的项目特征函数为 参数 函数,则被试在项目上得分不低于 分的概率 ()(),其中 为项目的区分度,是项目第 个等级的难度值,且 ,是项目第 个等级的猜测参数,且 ,是项目第 个等级的失误参数,且 令,(),可推出被试恰好得某分的概率 (),模型的非负性证明虽然 给各等级赋予不同的猜测参数和失误参数,但在上述参数的约束下,依然可以证明相减所导出的差为非负值,没有违背概率必须非负的规定,以下是证明过程由于 ()(),()对式()的 求偏导可得 (),()对式()的 求导可
7、得 ()()由于()恒大于,故 ()()结合式()式()可得 ,()()又由于 ,结合合式()和式()可得(),即 (),证毕通过图形描述,可以更进一步了解 的特点 图 给出了一个 等级的项目运算特征曲线和项目等级反应曲线,并给出该项目去除猜测参数和失误参数后的相应 曲线,以供比较研究参数 ,(,),(,),(,)-4-3-2-101234-4-3-2-1012341.00.80.60.40.20p1.00.80.60.40.20p4NPL-GRMGRM图 等级项目的项目运算特征曲线和项目等级反应曲线第 期曾 光,等:一种改进的 参数等级反应模型和应用 传统 的项目运算特征曲线是由 的项目反应
8、曲线组合而成,而 采用,其上下渐进值不再固定为 和,而是同时逐级递减 因此,观察图 的特征曲线,随着等级数增加,传统 的 特 征 曲 线 表 现 为 简 单 向 右 平 移,则可以被近似看作向右下方平移 因为 较 增加了逐级向下平移的趋势,在相邻级相减构建项目等级反应曲线中,的各级曲线左右渐进值必定远离 值,图 中 等级项目的等级反应曲线清晰地展现出这种特点 模型的比较为探究等级猜测参数与失误参数的存在必要性与差异性的影响,表 展示了 种模型的特征表 各个模型的特征比较模型等级数区分度难度猜测参数失误参数存在且唯一存在且唯一 存在且唯一 存在且唯一 存在且唯一 从传统的 发展而来,同样是一个减
9、法模型,用减法模型来描述这个多级评分项目 其参数分成 类,一类是描述等级的,如难度参数;另一类是描述整个项目的,如区分度参数,猜测参数和失误参数 对于,当等级数为 时,模型简化成,而当 且 时,模型又简化为 因此,该模型相较传统的 拟合能力和普适性更强 而本文提出的继承了引入猜测参数和难度参数的优点,在面对实际测验中多级反应项目(如当项目各选项考察的内容不一样)时,突破了猜测参数和失误参数必须一致的限制,将它们考虑为等级参数,个等级就会有 个猜测和失误参数,当 的各等级猜测参数和失误参数相同时,可以简化为 因此,进一步拓广了适用范围项目参数和潜在能力的条件估计 项目参数条件估计为了检验各模型的
10、拟合性能,使用固定项目参数的设计方法 假定被试能力值 (,),被试个数设为,设计 个由 道 级试题组成的测验 其中,号测验 (,),(,),;号测验在 号测验的基础上增加项目猜测参数 (,)和失误参数 (,);号测验在号测验的基础上增加等级猜测参数(,)、和等级失误参数(,)、模拟被试作答:满分为 分的多级记分试题,被试得 分及 分以上(即 分,分,分)的概率为,被试得 分及 分以上(即 分和 分)的概率为 ()(),被试得满分 分的概率为 ()()由此进一步得出,被试恰好得 分的概率为 ,被试恰好得 分的概率为 ,依据被试在试题上的作答概率,通过蒙特卡洛模拟方法产生被试得分估计方法采用适用条
11、件广泛、原理简单的三点法,并结合潜在能力真值进行极大似然估计,得到项目参数 最后,为了比较 种模型的偏差和返真性能,需要比较估计参数与真值,计算以下 种指标:平均偏差(,),平均绝对误差(,)和 均 方 根 误 差(,)(),(),其中和分别表示模拟数据第个项目参数的估计值和真值,评价结果见表 考察 号测验估计结果的返真性,使用各个模型的 与 指标进行比较,得到最大平均绝对误差(),最大均方根误(),这些评价指标明显均在正常范围内,返真效果较好,这说明 号测验数据适宜被、和 同时拟合 仅对比区分度和难度参数的返真效果,的 与 整体小于江西师范大学学报(自然科学版)年,的 与 又整体小于,这说明
12、在适用的基础上,模型拟真效果是不同的,对 号测验数据返真性排序为 表 各个测验的评价结果数据模型评价指标 号 号 号 考察 号测验估计结果的偏向性,比较各模型的区分度和难度参数的 和 后发现,均明显小于,这表明、和对 号测验数据的参数估计无显著偏向考察 号测验估计结果的返真性,使用各个模型的与指标进行比较,得到最大平均绝对误差(),最大均方根误差();得到 最大平均绝对误差(),最大均方根误差(),这些评价指标均在正常范围内,返真效果优秀 以上结果说明 号测验数据适宜被 和同时拟合,而是最大平均绝对误差(),最大均方根误差(),这些评价指标显著超出正常范围,结合估计参数与模拟数据进行卡方检验(
13、显著性水平),检验通过率为,这说明 号测验数据完全无法被 拟合 比较 和 的区分度和难度参数的返真效果,的 与 整体小于,因此对 号测验数据表现为 考察 号测验估计结果的偏向性,比较各模型的区分度和难度参数的和后发现,和 各估计参数的均明显小于,这表现出 和 对 号测验数据的参数估计的无偏向性,而 的(),(),表现出对 号测验数据的区分度估计有显著偏向,且偏向为负,即 区分度估计值相较于真值明显偏低考察 号测验估计结果的返真性,使用各个模型的与指标进行比较,得到最大平均绝对误差(),最大均方根误差(),这些评价结果显著超出正常范围,卡方检验通过率仅为 因此,号测验数据完全无法被 拟合;最大平
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 一种 改进 参数 等级 反应 模型 应用
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。