纵向题目作答时间模型:对潜在加工速度的变化追踪.pdf
《纵向题目作答时间模型:对潜在加工速度的变化追踪.pdf》由会员分享,可在线阅读,更多相关《纵向题目作答时间模型:对潜在加工速度的变化追踪.pdf(11页珍藏版)》请在咨信网上搜索。
1、应用心理学2024 年第 30 卷第 1 期应用心理学2024 年第 30 卷第 1 期,86-96Chinese Journal ofApplied Psychology2024.Vol.30.No.1,86-96纵向题目作答时间模型:对潜在加工速度的变化追踪*陈琦鹏1詹沛达1,2,3*(1.浙江师范大学心理学院,金华 321004;2.浙江省儿童青少年心理健康与危机干预智能实验室,金华 321004;3.浙江省智能教育技术与应用重点实验室,金华 321004)摘要本研究提出四个纵向题目作答时间(RT)模型以追踪潜在加工速度的变化。四者的测量模型一致,差异主要体现于描述潜在加工速度随时间变化
2、的结构模型。实证研究结果表明四者均有实践应用性且数据分析结果具有较高一致性。模拟研究表明四者在不同模拟条件下的参数估计返真性均良好。总之,本文提出的四个纵向 RT 模型具有可应用性且心理计量学性能良好;不仅丰富了纵向 RT 数据的分析方法,还拓展了纵向潜变量模型的应用范围。研究要点1.提出了可分析纵向题目作答时间数据的心理计量模型。2.拓展了纵向心理计量模型的数据分析范围。关键词题目作答时间;纵向数据;对数正态作答时间模型;潜在增长曲线;项目反应理论中图分类号:B841DOI:10.20058/ki.CJAP.022246*基金项目:浙江省哲学社会科学规划课题成果“问题解决能力测量新发展基于潜
3、变量建模理论与数据挖掘方法的思考”(22ZJQN38YB)。*通信作者:詹沛达,男,浙江师范大学副教授,e-mail:。1引言在心理与教育研究中,研究者通常对个体或群体在特定时间跨度中的认知或行为的发展变化感兴趣。这类研究的目标侧重于刻画每个个体的发展趋势和群体的平均变化轨迹(刘红云,孟庆茂,2003)。目前,针对不同的观测变量类型和潜变量类型(连续或分类)研究者们提出了众多纵向数据分析模型,比如纵向 Rasch/IRT 模型(Andersen,1985;von Davier er al.,2011)、潜PDF pdfFactory Pro 在增长曲线模型(Kaplan,2000)和潜在转换分
4、析模型(Collins&Lanza,2010)等。尽管纵向模型本身并没有限制所分析的数据类型及所测量的潜在建构,但纵观已有研究可发现几乎所有纵向模型仅关注对传统题目作答结果(response accuracy,RA)数据(e.g.,答对答错或李克特式题目得分)的分析,忽略了其他模态数据,进而局限于追踪RA 数据测量的心理建构(e.g.,潜在能力)的发展变化。随着计算机(网络)化测评的普及,除传统 RA 数据外,对诸如题目作答时间(re-sponse time,RT)等过程数据的采集已越发普遍(韩雨婷等,2022;刘耀辉等,2022)。在心理与教育测评中,RT 数据作为一种 RA数据的补充数据,
5、描述了个体解决单一问题的总耗时,可用于分析个体解决问题时的潜在加工速度。这在一定程度上打破了传统心理测量中对速度测验和难度测验的功能划分。另外,因 RT 数据“具有标准化数据结构,符合心理计量模型的建模与分析要求”(詹沛达,2022,p1417),近些年受到了研究者们的广泛关注,开发了诸多 RT模型(郭磊等,2017),比如对数正态 RT 模型(lognormal RT model,LRTM)(van derLinden,2006;Klein Entink,Fox et al.,2009)。但纵观已有研究可发现几乎所有RT 模型都仅适用于分析横断测评数据,即仅能分析被试在单一时间点测验中的潜在
6、加工速度,无法追踪个体潜在加工速度的发展轨迹。目前,随着计算机化测验的普及,一些形成性学测项目已经可以便捷地采集每个时间点上个体对每道题目的 RT 数据(即纵向 RT 数 据)(e.g.,Wang&Nydick,2020;Wang,Zhang et al.,2018)。Wang 和 Zhang等人(2018)发现在自适应学测系统中,随着干预(反馈/学习)次数的增加,学生群体在下一个时间点上作答所有题目的平均RT 会呈现下降趋势。Shi 等人(2018)发现在阅读理解任务中借助智能导学系统能够在一定程度上减少被试的 RT。而上述例子中导致观测变量 RT 减少的一个主要可能原因是被试的潜在加工速度
7、随时间发生了提高。此时,如何合理分析纵向 RT 数据以实现对潜在加工速度发展的客观追踪,是一个兼具理论与实践意义的议题。综上所述,已有的纵向数据分析模型主要聚焦对纵向 RA 数据的分析,少有研究关注纵向 RT 数据的分析;且已有的 RT模型多限于分析横断测评数据,无法追踪学生潜在加工速度随时间的发展。除联合分析 RA 和 RT 数据外,单独关注 RT 数据的分 析 也 很 常 见(e.g.,Guo et al.,2021;Klein Entink,van der Linden et al.,2009;vander Linden,2006;Wang,et al.,2013;詹沛达等,2020)。
8、对此,本研究拟基于两类常见的纵向数据分析方法(i.e.,多元正态分布建模和潜在增长曲线建模)对最具代表性的LRTM 进行拓展,提出四个纵向 RT 模型;以期实现对个体潜在加工速度发展的客观追踪并丰富纵向 RT 数据的分析方法。对此,下文将按如下逻辑撰写。首先,简单回顾横断 LRTM,并基于此提出四个纵向 RT模型。其次,通过对一则有关空间旋转能力的纵向 RT 数据的分析,呈现新模型的实践表现。然后,使用一则模拟研究去探究新提出的纵向 RT 模型在不同模拟测验条件下的表现。1纵向题目作答时间模型在心理计量模型中,纵向模型的一个核心作用是描述不同时间点上被试潜在建构的变化关系。本研究关注两类纵向建
9、模方式:一类是基于多元正态分布的纵向模纵向题目作答时间模型:对潜在加工速度的变化追踪87PDF pdfFactory Pro 应用心理学2024 年第 30 卷第 1 期型(e.g.,Andersen,1985;Paek,Li,&Park,2016;von Davier et al.,2011;Zhan et al.,2019),另一类是基于潜在增长曲线的纵向模型(e.g.,Bollen&Curran,2006;Kaplan,2000;Wang&Nydick,2020)。前者类似于多维 IRT 模型,直接利用多元正态分布对被试在各时间点上的潜在建构进行建模,并可利用均值向量描述不同时间点上群体
10、的发展轨迹;后者通过构建潜在建构与测验时间点之间的线性或非线性回归函数来描述潜在建构随时间点增加的变化趋势。基于上述两种建模逻辑,本文提出两类纵向 RT 模型:基于多元正态分布的纵向RT 模型和潜在增长曲线的纵向 RT 模型。上述两类模型的差异在于描述各时间点上潜在构建关系的结构模型,而测量模型保持一致。因此,下文先介绍统一的测量模型,然后再结合不同的结构模型逐一阐述四个新模型。1.1测量模型针对横断 RT 数据,LRTM 是目前最常用的 RT 测量模型之一。设定 Tni为被试 n(n=1,.,N)对题目 i(i=1,.,I)的作答时间。则 LRTM 可表示为logTni=孜i-准i子n+着n
11、i,着niN(0,棕i-2),(1)或logTniN(孜i-准i子n,棕i-2),(2)其中,子n是被试 n 的潜在加工速度;孜i为题目 i 的时间强度参数,表示被试群体作答题目 i 的平均耗时;准i为题目 i 的时间区分度参数,反映潜在加工速度对观察作答时间的影响程度;着ni为残差,棕i为题目 i 的时间精度参数。对于纵向测评而言,当整个测验包含P 个测验时间点,则第 p 个时间点上纵向LRTM 的测量模型可表示为:logTnipN(孜ip-准ip子np,棕ip-2),(3)其中,Tnip是时间点 p 上被试 n 对题目 i 的作答时间;孜ip、ip和 ip分别是时间点 p上题目 i 的时间
12、强度参数、时间区分度参数和时间精度参数;子np是时间点 p 上被试n 的潜在加工速度。1.2基于多元正态分布的纵向题目作答时间模型为描述 P 个时间点上 子np之间的关系,一种最直接的方法是构建多元正态分布,如图 1(a)。即假设 子n=(子n1,子nP)T是遵循多元正态分布的多维潜在加工速度向量:子nMVN(滋,撞)=MVN滋1滋P晌尚上上上上上裳捎梢梢梢梢梢,滓2子1籽1P滓子1滓子P埙籽1P滓子P滓子1滓2子P晌尚上上上上裳捎梢梢梢梢晌尚上上上上上上上上上上上上上裳捎梢梢梢梢梢梢梢梢梢梢梢梢梢,(4)式中,滋=(滋1,滋P)T为 P 个时间点的潜在加工速度的均值向量;撞 为方差协方差矩阵
13、,描述了 P 个时间点的潜在加工速度之间的关系。该模型直接估计的各个时间点上的潜在加工速度,因此可直接使用 子n描述被试个体潜在加工速度的发展轨迹。此时,可以用 子n(p+1)-子np描述相邻时间点个体水平的变化程度,用滋p+1-滋p描述相邻时间点群体均值的变化程度。该模型可视为多维 LRTM(詹沛达等,2020)在纵向 RT 数据分析中的应用。与多维 LRTM 一样,该模型中 的所有元素均需自由估计,即 中有 个待估计参数。该做法相对优点是考虑了所有时间点上潜在加工速度之间的相互影响,相对缺点是当时间点 P 数量较多时参数估计计算量较大且易出现估计不收敛问题。为缩减待估计参数数量,可通过引入
14、马尔可夫性质来约束 中的待估计参数,如图 1(b)。目前已有许多研究将马尔可夫性质引入纵向数据分析中(e.g.,de Haan-Ri-etdijk et al.,2017;Zhan,2020)。基于马尔可夫性质,可假设被试在时间点 p 的潜在加88PDF pdfFactory Pro 纵向题目作答时间模型:对潜在加工速度的变化追踪工速度只与其在时间点 p-1 的潜在加工速度有直接关系。对此,将 做如下转换:撞=S赘S,(5)S=滓子10埙0滓子P晌尚上上上上裳捎梢梢梢梢,(6)赘=1籽12 籽1P籽211 籽2P埙籽P1籽P21晌尚上上上上上上裳捎梢梢梢梢梢梢,(7)其中,S 为标准差矩阵,赘
15、 为相关系数矩阵。然后,因只考虑相邻时间点之间的直接关系,所以只需将相关矩阵 赘 中相邻时间点的相关系数 籽(p-1)p作为待估参数;而跨时间点的相关系数不视为待估计参数,由各相邻时间点上的相关系数连乘而来:籽ab=籽a(a+1)籽(a+1)(a+2)籽(b-2)(b-1)籽(b-1)b,(8)其中,籽ab为两个不相邻的两个时间点 a 和b 之间的相关系数,比如,籽13=籽12籽23。此时,撞中待估计参数数量由 P(P+1)/2 缩减为2P-1。为便于阐述,下文将不包含马尔可夫性质的和包含马尔可夫性质的模型分别简称为 MVN-LRTM 和 MVN-LRTM-M。另外,在采用锚题设计和重复测量设
16、计的情况下,可将第一时间点上所有被试的潜在加工速度的均值和方差分别约束为 滋1=0和滓2子1=1 以保证模型的可识别性(Paek etal.,2016)。1.3基于潜在增长曲线的纵向题目作答时间模型为描述 P 个时间点上 子np之间的关系,多元正态分布外的另一种方法是构建潜在增长曲线,如图 1(c):子np=仔0n+仔1n(p-1)+着np,着np耀N(0,滓2着p),(9)仔0n仔1n蓸蔀MVN滋仔0滋仔1蓸蔀,滓2仔0籽仔0仔1滓仔0滓仔1籽仔1仔0滓仔1滓仔0滓2仔1蓸蔀蓸蔀,(10)式中,仔0n为被试 n 的截距系数,表示被试 n的初始潜在加工速度水平;仔1n为被试 n 的增长系数,表
17、示被试 n 的潜在加工速度随时间变化的程度;仔0n和仔1n服从二元正态分布,两者的均值滋0n和滋1n分别代表群体潜在加工速度的均值和群体潜在加工速度的平均增长率,方差协方差矩阵则描述了潜在加工速度的初始水平和增长系数之间的关系:籽仔1仔00 意味着初始水平越高的被试,其潜在加工速度随时间的增幅越大,反之则反;着np为残差。与 MVN-LRTM 不同,该模型没有直接估计各时间点上的 子np,而是估计了每个被试的增长曲线系数(i.e.,仔0n和仔1n);此时,可以用仔1n描述相邻时间点个体水平的变化程度,用滋仔1描述相邻时间点群体均值的变化程度。公式 9 假设 子np随测验时间点的增加呈线性增长,
18、而现实中 子np随测验时间点的增加也可能呈非线性增长。此时,可在公式9 中增加二次增长项来实现对潜在加工速度的非线性变化的描述,如图 1(d):子np=仔0n+仔1n(p-1)+仔2n(p-1)2+着np,着np耀N(0,滓2着p),(11)仔0n仔1n仔2n晌尚上上上上裳捎梢梢梢梢MVN滋仔0滋仔1滋仔2晌尚上上上上裳捎梢梢梢梢,滓2仔0籽仔0仔1滓仔0滓仔1籽仔0仔2滓仔0滓仔2籽仔1仔0滓仔1滓仔0滓2仔1籽仔1仔2滓仔1滓仔2籽仔2仔0滓仔2滓仔0籽仔2仔1滓仔2滓仔1滓2仔2晌尚上上上上裳捎梢梢梢梢晌尚上上上上上上上上上上上上裳捎梢梢梢梢梢梢梢梢梢梢梢梢,(12)式中,仔2n为被试
19、n 的二次增长系数,其余参数同上。除包含二次增长项外,非线性增长模型中还可以进一步包含三次增长项或自由估计时间参数,限于篇幅限制本文暂不关也有研究不考虑残差项(e.g.,Curtis,2010),即 子np=仔0n+仔1n(p-1);预研究结果表明不考虑残差项的模型对实证数据的拟合结果较差.89PDF pdfFactory Pro 应用心理学2024 年第 30 卷第 1 期注它们。为便于阐述,下文将基于线性增长曲线和基于非线性增长曲线的模型分别称为 LGC-LRTM-L 和 LGC-LRTM-N。另外,在采用锚题设计和重复测量设计的情况下,可将第一时间点上所有被试的潜在加工速度的均值和方差分
20、别约束为滋仔0=0 和滓2仔1+滓2着1=1 以保证模型的可识别性(e.g.,Wang&Nydick,2020)。图 1四个纵向题目作答时间模型示意图(P=3)注:虚线表示非相邻时间点之间的相关;“*”表示该相关系数由相邻时间点相关系数连乘得到。2实证数据分析2.1数据描述与分析本研究以一则有关空间旋转能力的自适应学测数据(Wang,Yang et al.,2018)为例来展现所提出模型的实践可应用性。该数据集包含 350 名被试在 5 个时间点上的作答数据,数据集的详细描述信息可见附录 S1。图 2 呈现了题目的对数 RT 随时间变化趋势(剔除缺失值),可发现明显的下降趋势。分别使用 MVN
21、-LRTM、MVN-LRTM-M、LGC-LRTM-L 和 LGC-LRTM-N 作为数据分析模型。模型参数估计设定及不同信息量先验下的稳健型分析可见附录 S2。使用潜在量尺缩减因子(PSRF;Brooks&Gel-man,1998)对作为 MCMC 算法的收敛指标。使用后验预测模型检验(PPMC)评估模型对数据的绝对拟合程度;在计算后验预90PDF pdfFactory Pro 纵向题目作答时间模型:对潜在加工速度的变化追踪测概率(ppp)时较了观察数据 X 和后验预测数据 Xpostpred之间的差异:ppp=Ee=1(Sum(Xpostpred(e))逸Sum(Y)/E,其中 E 为 M
22、CMC中的抽样次数,Xpostpred(e)为第 e 次抽样中的后验预测值,由公式 3 计算得到。使用-2LL(-2log likelihood)和 DIC(Spiegel-halter et al.,2002)作为模型-数据相对拟合指标。有关拟合指标更多的信息可见附录 S3。图 2实证研究 5 个时间点上 50 道题目的对数题目作答时间分布2.2结果需要强调的是,MVN-LRTM 中潜在加工速度的方差协方差矩阵中部分元素没有达到收敛标准(PSRF1.2),表明模型参数估计值没有稳定在一个特定值附近;在不收敛情况下得到的估计值(后验均值),无法排除 MCMC 随机抽样误差的影响,难以反映数据本
23、身所蕴含的特性;因此,该模型与数据的拟合结果仅供参考。其他三个模型的所有模型参数均达到收敛标准。表 1 呈现了四个模型对实证数据的拟合情况。首先,根据各时间点上的 ppp 值,表明四个模型均拟合该数据。其次,不考虑MVN-LRTM 时,剩余三个模型的对数据的相对拟合比较接近。其中,-2LL 指标值表明,在不考虑模型复杂性惩罚的前提下,LGC-LRTM-N 对该数据的拟合相对最好,即该模型得到的参数估计值相对最能反映数 据 的 特 征。而 DIC 指 标 值 表 明MVN-LRTM-M 对该数据拟合相对最好,LGC-LRTM-L 次之且和 LGC-LRTM-N 几乎没有差异。总之,当考虑模型复杂
24、性惩罚时,MVN-LRTM-M 对该数据拟合相对最好,而 不 考 虑 模 型 复 杂 性 惩 罚 时,LGC-LRTM-N 的参数估计结果最能反映数据本身特征。图 3 呈现了四个模型中所有被试潜在加工速度随时间的变化趋势(含群体均值变化)。对任何模型而言,潜在加工速度的群体均值都呈较明显的增长趋势。图 4 呈现了四个模型中所有时间点上潜在加工速度的估计值之间的相关系数图。可以看到,无论是同一模型对 5 个时间点上潜在加工速度的估计值之间,还是不同模型对同一时间点上潜在加工速度的估计值之间,均呈现高程度相关。一方面表明不同模型的估计值之间具有高度一致性,另一方面表明不同时间点上潜在加工速度之间也
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 纵向 题目 作答 时间 模型 潜在 加工 速度 变化 追踪
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。