基于书签法的学科关键能力水平划分研究.pdf
《基于书签法的学科关键能力水平划分研究.pdf》由会员分享,可在线阅读,更多相关《基于书签法的学科关键能力水平划分研究.pdf(10页珍藏版)》请在咨信网上搜索。
1、收稿日期:基金项目:作者简介:2023-10-18北京市教育科学“十四五”规划课题“学习进阶视角下的学生科学思维发展研究”(BECA21112)宋昕昊,男,北京师范大学教育学部在读硕士生;刘奕轩,女,北京师范大学物理学系在读博士生;姚建欣,男,北京师范大学物理学系副教授,博士生导师(通信作者)。宋昕昊刘奕轩姚建欣(北京师范大学,北京 100875)基于书签法的学科关键能力水平划分研究摘要:对学科关键能力的水平划分是研制和应用学业质量标准的基础。相比安戈夫法等传统水平划分方法,书签法在扩大评价工具适用范围、降低专家判断负担等方面具有明显优势,近年来在国际大型教育测评项目中得到越来越广泛应用。本研
2、究聚焦科学教育领域的模型认知与模型实践能力,首先通过理论研究确定能力维度和水平预设,随后在实证研究中使用书签法厘定分界分数、描述表现水平,并据此提出七维度五水平的模型认知与模型实践能力表现框架。研究过程展现了应用书签法对学科关键能力进行水平划分的技术路线,对书签法的应用实践提出遵循规范流程、简化供给专家数据、平等讨论作出决策等操作建议。关键词:能力评价;水平划分;书签法;学业质量;模型认知;模型实践【中图分类号】G405【文献标识码】A【文章编号】1005-8427(2024)04-0058-10DOI:10.19360/ki.11-3303/g4.2024.04.007在新一轮基础教育课程改
3、革中,反映核心素养发展状况的学业质量标准对于教学与评价设计起着引领作用。学业质量标准是依据学科核心素养水平划分,对学生完成学科课程学习后的学业成就表现的总体刻画1。关键能力是核心素养的重要组成部分,对学科关键能力的水平划分是研制和应用学业质量标准的基础,也是当前评价研究的重点。在科学教育领域,理解、建构与使用模型是科技工作者探究世界和学生学习科学的有效工具。我国理科各科课程标准、美国新一代科学教育标准(Next Generation ScienceStandards)等均提出学生模型认知与模型实践的明确要求。在此背景下,本研究聚焦模型认知与模型实践能力,使用书签法对高中生的能力表现进行水平划分
4、,以期为学科关键能力的水平划分探索方法路径,并基于研究过程对书签法的应用提出建议。一、理论基础标准参照测验与分界分数是相伴而生的,但很多测评项目中分界分数的设定是遵循惯例甚至是武断的2。标准参照测验在20世纪60-70年代广泛应用,使得如何科学、客观地设置分界分数成为评价研究的一个重要问题。这一时期被视为是水平划分研究工作的觉醒时代(awakeningage)3。此期间涌现出许多水平划分方法,包括安Journal of China Examinations2024年第4期No.4,2024戈夫法(Angoff method)、阿贝尔法(Ebel method)、对比组方法(contrastin
5、g-group method)、随机逼近法(stochastic approximation)等。从教育测量的视角出发,早期定义水平划分为遵循合理、客观、严谨的规则和程序,确定可区分两种或两种以上表现程度的数值范围的研究工作4。该定义遵循参数估计范式,侧重于划分程序的规范与严谨。进一步考虑水平划分的本质,当前定义水平划分为各专家独立判断并加以综合,创建不同的表现分类以将卷面分数分隔为有意义、有用的区间的过程518。安戈夫法是大型考试中最常用的水平划分方法。安戈夫法基于经典测量理论(classical testtheory),通过估计最低能力表现考生(minimal accepted perso
6、n)正确回答每道试题的概率产生分界分数。安戈夫法提出以后,还出现了十几种衍生方法。20世纪 90年代,随着计算机自适应测试等新型测试形式的出现,以及项目反应理论(item response theory)在教育测量和心理测量中的广泛应用,传统水平划分方法受到挑战。在此背景下,Lewis等提出书签法(bookmark method)6。当前,书签法在PISA、TIMMS等国际测评项目中得到广泛应用,在我国国家基础教育质量监测、美国国家教育进展评价(National Assessment ofEducational Progress)等国家教育测评中也发挥出越来越重要的作用7。在书签法中,专家围绕
7、由易到难排序的有序试题册(ordered item booklet)对试题开展讨论,将书签放置在刚好到达某水平的学生能“掌握”的试题处。由此,书签位置提供了分界分数,而书签之间的试题为表现水平描述提供依据。与安戈夫法等传统的水平划分方法相比,书签法具有三个明显优势。第一,书签法适用试题类型范围更广。在传统的水平划分方法中,不同类型的试题需选用不同的水平划分方法,例如,安戈夫法更适用于单项选择题,对比组方法等以学生为中心的水平划分方法(examinee-centered method)更适用于主观题。因此,传统的方法需要额外的步骤以整合多种方法产生的分界分数8,而书签法对当下常见的各类型试题均适
8、用。实际上,Lewis等开发书签法的初衷就是用统一的方法对各类试题进行水平划分。第二,书签法认知复杂度低,简单易操作。安戈夫法需判断出最低能力学生正确作答的概率,该过程是在0至100%中进行主观估计,属于大小判断(magnitude judgement)。而书签法只需判断最低表现学生能掌握的试题,专家只需在有序试题册范围内选出最低能力考生刚好掌握的试题,属于分类判断(categoricaljudgement),分类判断在认知层面更为简单9269。而且,书签法需要专家作出判断的次数更少。假设使用50道题组成的测试工具将学生划分五个水平,采用安戈夫法时每位专家共需做出200次判断(50个试题 4个
9、分界分数),而使用一轮书签法每位专家只需做出四次判断。第三,书签法能将表现描述与测评工具联系起来。水平划分任务应包含分界分数的确立以及表现水平的描述两个环节10。在书签法中,分界分数由书签在有序试题册中的位置产生,同时书签也将有序试题册分成不同的部分,有序试题册中各书签之间的试题为水平描述提供了依据。二、研究过程前期研究通过对科学哲学领域的模型观、学生模型认知以及学生模型实践表现的综述,提出模型认知与模型实践能力的学习进阶框架。在框架中,模型认知方面包括模型本质、可变性及功能,模型时间方面包括模型使用、评估、修改和建构新模型,各维度基本包含四至五个水平,共同组成七维度五水平的进阶框架11。为进
10、一步了解学生在模型认知与模型实践方面的真实能力宋昕昊 等:基于书签法的学科关键能力水平划分研究592024年第4期表现,从而优化学业质量标准的设定,本研究开发了学生模型认知与模型实践能力测评工具,实施测评并进行水平划分。测评工具包括模型认知和模型实践两部分,其中模型认知试题来源于Treagust等开发的量表12,模型实践试题源于学业质量监测题库。完整的测评工具共包含20道模型认知试题和45道模型实践试题。采用水平链接的方法将其分成四套平行试卷,包含选择链接设计、重组试题并分析、评估链接质量、整体分析四个步骤13,最终确定五道模型认知题和五道模型实践试题为链接题。在K市某三所中学高一年级中进行随
11、机抽样确立被试(N=724)。测试数据分析采用R软件中的TAM包中的部分评分模型(partial-credit model)。本研究重点介绍研究过程中的水平划分部分。研究使用书签法进行水平划分共分为三个阶段:准备阶段、实施阶段以及评估阶段。具体流程见图1。(一)准备阶段准备阶段分为两个环节:材料准备以及专家准备。有序试题册的制作是书签法材料准备阶段的首要任务。在制作有序试题册前,需选定“掌握”决策点。书签法对“掌握”的定义基于作答概率(response probability,简称RP值),若学生正确作答某试题的概率到达某一特定RP值,则认为学生“掌握”该试题。美国教育考试中心(Educati
12、onal Test Service)一般选取RP=0.800,而在NAEP中,RP值选为0.65014。有研究证实,选RP取值为(c+2)/3时对书签法最有利15。由于本研究使用Rasch模型,猜测参数c取值为0,因此本研究选择2/3决策原则,这也是目前书签法中最常用的RP取值。0-1计分试题与多级计分试题被制作进同一有序试题册中。其中,多级计分试题在有序试题册中会多次出现,每一次出现代表学生得到某一等级分。Rasch模型将试题的难度和学生的能力放到同一标尺上,因此可以将每道试题或各等级分在2/3决策点处的学生能力值作为试题的难度定位值。R 软件中的 TAM 包可生成试题特征曲线(ICC)的坐
13、标值,借助TAM包可得到各试题(或各等级分)的决策点能力值。对于0-1计分试题,若学生正确作答的概率为 0.667,则认为学生掌握了该试题;对于多级计分试题,学生掌握某一等级分对应的知识与能力被定义为学生得分大于或等于该等级分的概率为 0.6675162。图 2a为 0-图 1 书签法基本流程图 2 两类试题的特征曲线0.5820.0840.666=+1分2分0.393201-1-20.6670.0581.0P()0.80.60.40.20.01.0P()0.80.60.40.20.0201-1-2ba60题号1-11-21-32-12-22-33-13-23-34-14-24-35-15-2
14、5-36-16-26-37-17-27-38-18-28-39-19-29-310-110-210-3决策点能力值-1.646-0.0101.856-0.7321.0741.635-0.4320.9732.131-0.6520.8332.378-1.636-0.3641.697-1.515-0.3541.254-1.1740.1722.197-1.596-0.4721.756-1.3950.1622.538-1.2730.0701.977题号11121314151617181920-120-221-121-222232425262728-128-228-329-129-229-330-130-
15、230-331-131-2决策点能力值1.5280.929-0.3350.761-1.9201.5221.9373.7350.648-0.6921.3752.0172.7373.0190.9141.3333.2112.519-0.750-0.1911.7072.418-0.8531.1742.799-0.956-0.2310.393-1.896-0.194题号31-332-132-233-133-233-334-134-235-135-235-33637383940414243-143-243-344-145-145-246-146-24748-148-249-1决策点能力值0.636-1.0
16、33-0.551-1.2540.1301.404-0.5120.773-0.9490.6262.3981.7702.0252.2831.886-1.236-0.4920.058-1.283-0.0701.274-1.052-1.4350.090-0.632-0.182-1.5770.3933.0711.166题号50-150-251525354-154-255-155-256-156-256-357-157-25859606162-162-263-163-263-364-164-265-165-265-3决策点能力值-0.7120.707-4.3571.4252.3492.7473.0860.
17、4312.278-1.074-0.3430.311-0.973-0.411-0.3802.2651.3110.1312.1413.6770.7171.4243.0852.3583.020-0.2110.0500.873表 1 试题决策点(RP=2/3)能力值1计分试题42题的ICC,能力值为0.058的学生正确作答42题的概率为0.667,因此认为该题的决策点能力值为0.058;图2b为多级计分试题48题的 ICC,能力值为 0.393 的学生得 1 分的概率为0.084,得2分的概率为0.582,学生得分大于等于1分的概率约为0.666,因此,判断该题等级分1分的决策点能力值为 0.393。
18、基于该方法,可得到全部试题的决策点能力值。表1展示本研究全部试题的决策点能力值。随后,将决策点能力值从小到大进行排序,得到有序试题册。有序试题册共包含118页,代表全部的试题总分为118分。图3是有序试题册的第26页试题。除有序试题册外,还需为专家准备实测试卷、标准答案等。多级评分试题还需为专家准备评分标准,以及各等级分对应的典型学生作答案例。专家准备阶段主要包括专家的挑选以及培训。书签法一般挑选精通教育测量以及熟悉本次水平划分的学科领域的专家。在大规模测试或高利害测试中,每学科需要1220名专家,5宋昕昊 等:基于书签法的学科关键能力水平划分研究612024年第4期图 3 有序试题册示例7人
19、一组,分成3组,在探索性研究中专家数量要求可适当降低。本研究为科学教育中的单一关键能力的探索性研究,因此选择7位熟悉模型认知和模型实践能力并有一定教育测量基础的科学教育研究者。专家培训中,首先需明确待进行水平划分的能力或素养、介绍测评工具以及明晰书签法的基本原理及流程。其中,有关书签法技术的培训需使专家明确放置书签的数量、熟悉书签法的基本操作流程、知晓有序试题册中各信息的具体含义、掌握书签法中各表单的填写方法。同时还应特别强调:书签代表最低合格学生能掌握的试题与不能掌握的试题之间的分界点;书签代表两组试题的分界,而不是两道试题的分界;成绩恰好为分界分数的学生正确作答书签处试题的概率为 0.66
20、7,学生有更高的概率答对比该试题容易的试题,而有更低的概率答对比该试题更难的试题9254。本研究中的培训会议内容由对学生模型认知与模型实践能力研究基础的培训、学生模型认知与模型实践能力测评工具的介绍及对书签法的培训三部分组成。(二)实施阶段本研究共进行三轮书签法。每轮书签法设置三个环节:报告(presentation)、讨论(discussion)和放置书签(voting),简称 PDV流程。在前两轮书签法中,7位专家被分成两个小组,两小组独立进行水平划分。第三轮书签法,7位专家一起进行水平划分任务。在第一轮书签法中,由阅卷人员报告评分过程中的相关情况与学生的作答情况,专家在小组内讨论正确回答
21、每道试题需具备的知识与能力,随后专家独立地放置书签并填写表单。在第二轮书签法中,由小组组长报告本小组第一轮书签法的结果,专家讨论不同水平的学生应掌握的知识与能力,并在第一轮书签法的结果范围内讨论试题,随后专家独立地放置书签并填写表单。在第三轮书签法中,由两个小组选派代表汇报两小组前两轮书签法的结果及其对不同水平学生能力的描述,同时为7位专家报告第二轮书签法结果确立的学生在各水平的分布。利用前几轮书签法的结果生成辅助专家进行最终书签放置的数据被称为影响数据(impact data)。随后,7位专家共同进行最终的讨论,独立地放置书签并填写表单。7位专家第三轮书签法的中位数作为书签法的最终结果。Ra
22、sch模型计算出的学生能力值参数一般在-6,6区间。为方便理解,书签法通常采用原始分报告分界分数。其中,将决策点能力值转换为原始分的方式有三种:使用书签前一个题的决策点能力值转化分界分数,使用书签前后两个题决策点能力值的均值转换分界分数,使用reckase方法转换分界分数16。本研究选择书签前一个题的62决策点能力值转化分界分数的方法,一般使用线性回归得出原始分与能力值的转换方程。若测试存在多套平行卷,由于没有学生完成全部的试题,且各平行卷的卷面总分可能不一致,需使用真分数7。IRT提供了某一特定能力值的学生在各试题得到某一确定分数的概率,由此可用以下公式计算真分数,True Score=im
23、miPim(),其中,i代表某道试题,m代表其等级分。本研究包含四套平行试卷,借助TAM包IRT.truescore指令生成各能力值与真分数的转换表,用真分数报告第三轮书签法中所需的影响数据以及分界分数。(三)评估阶段书签法中各专家达成共识的程度是评估书签法有效性的重要依据。各专家在三轮书签法中书签放置位置的汇总图可以展示书签法中专家达成共识的程度17。本研究中84个书签的位置,见图4。经过三轮书签法,7位专家对第一个书签的位置意见统一;对第二个和第四个书签位置的意见基本统一;第三个书签6位专家意见统一,仅有一位专家偏离。综上,经过三轮书签法,本研究中的7位专家基本达成共识。在7位专家完成三轮
24、书签的放置后,本研究使用Cizek等开发的问卷18评估水平划分的质量。评估问卷由15题构成,前14道题设置四个选项:非常不同意、不同意、同意、非常同意,主要用以评估培训会议、水平划分过程以及信息资料是否有效支撑了水平划分工作。第15题为开放题,请专家自行撰写对此次水平划分工作的评价与建议。本研究中7位专家均选择同意或非常同意,说明本次书签法具有良好的过程效度以及知觉效度。三、研究结果本研究采用书签法对学生模型认知与模型实践能力进行水平划分,7位专家书签位置一致性与评估反馈问卷表明了书签法的结果具有良好的效度。经过三轮书签法,本研究共生成四个分界分数,从而划分出学生模型认知与模型实践能力的五个水
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 书签 学科 关键 能力 水平 划分 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。