外语测评在外语教育学科中的内涵与作用_罗凯洲.pdf
《外语测评在外语教育学科中的内涵与作用_罗凯洲.pdf》由会员分享,可在线阅读,更多相关《外语测评在外语教育学科中的内涵与作用_罗凯洲.pdf(6页珍藏版)》请在咨信网上搜索。
1、2023 年 3 月第 44 卷 第 2 期 Foreign Language Education Mar.2023Vol.44 No.2外语测评在外语教育学科中的内涵与作用罗凯洲,韩宝成摘 要:外语测评是外语教育学科中的重要研究领域之一,它与外语教育其他领域存在直接或间接的关联。厘清关联有助于规避测评的误用,促进不同研究方向融合与发展。本文全面剖析了外语测评对外语教育其他方向的作用,主要包括规范课程评价、反拨教学实践、运用课堂测评、确定语言水平、辅助任务编制、提升测评素养、检验语言能力假设、充当政策工具。关键词:外语测评;外语教育学;关联中图分类号:H319 文献标识码:A 文章编号:100
2、0-5544(2023)02-0057-06Abstract:As a vital field of study under the umbrella of foreign language education,language assessment is directly or indirectly connected to other research fields.Clarifying the connections would help avoid assessment misuse and advance different fields in an integrated way.T
3、his paper analyzes how language assessment interacts with other fields from several aopects,including facilitating curriculum evaluation,exerting intended washback on teaching practices,fitting itself as classroom assessment,locating the proficiency level of language learners,guiding task design,imp
4、roving assessment lit-eracy,examining hypotheses of language competence,and implementing language policies.Key words:foreign language assessment;foreign language education;connections1.外语测评的内涵 在外语教育领域,“外语测评”时而用作“测量工具”,成为资源分配、资格认定、人才选拔、编班分级、衡量成就、监督进展等教育决策的主要依据;时而用作“测评活动”,外语教师在教学过程中隐性或显性地使用测评,测评成为教学活动
5、的重要环节,教师依据测评结果做出形成性或总结性教学决策。无论是工具还是活动,人们使用测评的核心目的在于采集所测能力的外显表现,以做出能产生正面影响的决策(Bachman&Palmer 2010:38)。由此,“测什么能力”(构念界定)、“怎样测才能准确诱发作答表现”(任务编制)以及“测评结果的解读与使用是否符合预期”(效度验证)便构成了外语测评这个研究领域的主要研究内容(Chapelle et al.2019)。外语测评是外语教育学科中的重要实践领域(李民、王文斌 2019),具有鲜明的交叉学科属性,与语言学、外语教学、外语学习、教育与心理测量等领域有直接或间接的关联。若误用测评,不仅会对教与
6、学产生负面影响,相关研究的可靠性也会大打折扣。Bachman&Cohen(1998)认为梳理测评与其他研究领域之间的关联,有助于规避对测评的误用,使不同研究领域相互促进。研究领域间的关联是双向的,为避免重复讨论,本文着重从外语测评角度谈该方向对其他方向的作用。2.外语测评与外语课程 课程规划主流观点认为课程评价是其重要组成部分(Richards 2017:277),外语测评对外语课程的作用主要体现在规范课程评价结果的解读与使用。广义的课程评价是对课程设计、目标、教材、讲授等课程规划各要素质量进行的全面评价;狭义的课程评价是对学习者为主的个体进行的评价(Richards&Schmidt 2010
7、:206)。后者通常是评价的重点,也是外语测评领域的主要研究对象。无论对课程进行全面评价,还是对个体表现进行评价,均需借助具体的测评手段(如完整的考试或独立的任务),而对测评结果的合理解读与使用(即效度验证)是评价最核心的议题(AERA et al.2014:11)。当前,基于论证的效度验证思想已被国际教育评价领域广泛接受。然而,这一思想用于外语课程评价的案例仍不多见。基于论证的效度验证思想以 Toulmin(1958)的实用论证模型为理论基础,认为由事实(fact)主张(claim)的推理过程需要论证,论证需要理据(warrant)支撑,虽然一项论证还可能出现证据、反驳、限定等要素,但事实、
8、主75DOI:10.16362/61-1023/h.2023.02.010张、理据被视为论证的核心要素(van Eemeren et al.2014:219)。基于论证的效度验证思想具体衍生出解释/使用论证(interpretation/use argument,简称 IUA)(Kane 2013)和测评使用论证(assess-ment use argument,简称 AUA)(Bachman&Palmer 2010)两个操作模式,两者并无本质差异,但 AUA模式可同时服务于评价项目的开发与验证,更适用于课程评价,下文重点关注这一模式。人们使用具体测评手段进行课程评价的关键在于能否对课程(个体
9、)产生正面“影响”,而影响是否正面取决于“决策”是否合理,决策是否合理又与对测评结果“解读”是否准确有关,解读是否准确则取决于量化或质性的“评分”质量。由此,影响决策解读评分就形成了逐层推理的过程,这就是 AUA 模式的基本构成(见图 1)。图 1.初级英语听说课程测评使用论证(AUA)图 1 展示了某学校使用初级英语写作课(期中及期末)考试进行评价的假想案例。依照 Toul-min(1958)实用论证模型和 Kane(2006)基于论证效度验证思想,图 1 中的每段推理,都需要论证。限于篇幅,案例只包含了 AUA 的核心要素(即事实、主张和理据)。其中,基于写作考试任务的学生作答(表现)是客
10、观事实无须论证,依照学生作答(表现)推出的评分主张由对应理据支撑,若具体证据(如通过统计得出的一致性指标)能够支持对应的理据,评分主张就成为下一段推理的事实,依此类推,形成环环相扣的推理论证链。为保证课程评价质量,初级英语写作课程测评使用论证应在课程设计之初完成构建,不能等课程结束后再去构建和论证。需特别指出,测评使用论证模式的可贵之处在于各主张的可证伪性,改变了以往效度验证“证实主义”的倾向。当某段推理的主张及其理据暂未得到证据的充分支持,可成为发现课程评价真问题的契机。3.外语测评与外语教与学 外语测评和教与学的关系最为紧密。外语教与学的路径与方法很大程度上影响了外语测评的路径与方法(韩宝
11、成 2003;Weir et al.2013)。外语测评也对教与学发挥重要影响,体现在反拨教学实践、运用课堂测评、确定语言水平等方面。3.1 反拨教学实践20 世纪 80 年代后,以美国托福、英国雅思、中国大学英语四、六级和高考英语为代表的超大规模标准化外语考试引发了各界广泛关注。人们依照上述考试的成绩做出各类高利害决策,对教学实践产生重要影响。研究者将测评对教学实践产生的影响称为“反拨效应”(washback effects)(Al-derson&Wall 1993)。测评领域对反拨效应的关注与整体效度理论(Messick 1989)强调成绩使用带来的社会影响(social conseque
12、nces)不无关联。20 世纪 90 年代后,反拨效应一度成为测评领域的研究热点。反拨效应研究表明测评对于教学的负面影响往往大于正面影响。所谓负面影响主要指教学内容和方法偏向应试,偏离了既定目标。近年来,我国学者也透过反拨效应研究发现了外语教学普遍存在的问题。亓鲁霞(2017)在调查初二年级英语教学现状时发现英语教学与大纲(或课标)的要求相去甚远。初二教材中有助于培养英语综合运用能力的任务被弃之不用,取而代之的是针对中考英语的语言知识灌输与机械操练。这些现象在高中英语教学,甚至大学英语教学中也屡见不鲜。表面上看,是测评带来了所谓的负面反拨。然而,造成负面反拨的根本原因是人们对测评的误解与误用。
13、为扭转不科学的评价导向,外语教育工作者要理解测评本质,区分测评功能。在评价课程或教学质量时,管理者应关注教师对教学大纲(课标)的完成情况,以及学生对既定能力要求的掌握情况。测评开发及研究者要特别关注现实世界的外语实际使用情况,熟悉语言学、外语教学与学习的相关理论,深入了解外语教学现状,并以前沿测量理论做指导,界定测评构念、编制测评任务并实施效度验证。一线教师也应该提高自身85罗凯洲 韩宝成 外语测评在外语教育学科中的内涵与作用测评素养,树立科学测评理念,通晓各类测评模式,妥善处理好测评与教学的关系。唯有各方共同努力,测评与教学才能“融合”,而非“对立”,正面反拨效应才会显现。3.2 运用课堂测
14、评传统观念认为由专业机构研发的标准化测评与教师自主实施的课堂测评“泾渭分明”。这一观点隐含不少有待商榷的“预设”。例如,将标准化测评等同于总结性测评,课堂测评等同于形成性测评;认为标准化测评是高利害测评,课堂测评是低利害测评;笃信总结性测评通常给教学带来负面反拨,形成性测评才能带来正面反拨。其实,教育与心理测量主流观点认为标准化测评与课堂测评并非“互斥”关系,而是测评实施或使用的环境存在差异;总结性测评与形成性测评也非“互斥”关系,而是决策的类型不同,在一定条件下“总结”与“形成”可以相互转化;此外,测评能否带来正面反拨与其类别及决策利害程度并无直接关系,关键在于对结果的解读与使用是否合理。具
15、体来看,课堂测评并非测评的一种固定“类别”,而是发生在课堂环境中的测评活动。有别于“课堂之外的测评”,“课堂之内的测评”更专注服务教学决策,实现促学目的。Bachman&Dambck(2018:17)认为课堂环境中测评的使用有隐性和显性之分。在隐性课堂测评中,学生并未意识到测评发生,测评活动以观察、提问等常见形式出现,与教学浑然一体。讲授活动持续交替进行。隐性的课堂测评决策以形成性为主,包括纠正学生回答、调整提问方式、提供作答范例、重复讲授内容、改变讲授速度等。隐性的课堂测评偶尔也有总结性决策,如依照参与程度或表现好坏决定学生是否重做任务。显性课堂测评的特点是测评与讲授活动区分明显,学生明确知
16、晓测评活动发生。显性的课堂测评决策以总结性为主。例如,某学校英语口语课结束后,教师实施期末考试,其主要目的在于认定学生能否进入下一阶段课程学习。显性的课堂测评决策其实也能转化为形成性决策。例如,学生拿到了带有诊断信息的期末口语成绩报告单后,了解自己在语音语调、语言运用、话题阐述等方面的优势与劣势,由此明确了努力方向并调整了学习目标和内容。在隐性和显性课堂测评之间还存在一些名为“测评”实为教或学的课堂活动,如自我评价、同伴互评、档案评价(portfolio assess-ment),其相关结果一般用于形成性决策。3.3 确定语言水平外语测评与外语学习研究也有千丝万缕的联系。外语学习领域的研究者时
17、常借用各类测评手段辅助研究的设计与实施,由此做出研究决策。总体来看,外语测评对外语学习研究的主要作用在于确定被试的语言水平(Drackert 2015:21)。例如,使用测评筛选特定语言水平的被试参与实验;部分研究会把语言水平(具体分数或等级)直接作为变量融入研究设计与研究问题;还有一些研究旨在发现造成被试语言水平差异的因素。Bachman(2004:10)曾总结外语测评在外语学习研究领域辅助决策的类型,如通过测评结果决定未来研究是否引入新的研究问题或研究方法、更新人们对特定语言现象的描述和解释等。合理的研究决策要依靠测评手段的正确使用与解读。在外语学习研究中常见的测评手段有元语言判断(met
18、alinguistic judgement)(如语法正确性判断)、选择型作答任务(如多项选择题)、半开放的建构型作答任务(如填空题)以及全开放的建构型作答任务(如邮件写作)。遗憾的是,有些研究在测评手段使用与解读方面存在偏差,进而影响研究决策的可靠性。例如,研究中采用的测评任务(或试题)数量不足,难以保证结果的一致性;缺少高质量的评分标准,所得结果解读含混不清;未计算和汇报必要的统计指标(如难度、区分度、信度),难以确保结果的可靠程度(Purpura et al.2015)。因此,不少学者(如Bachman&Cohen 1998;Winke&Brunfaut 2021)都曾呼吁,两个领域研究者
19、必须加强沟通才能取得实质进步。外语学习研究者要了解测评的重要理论,如效度验证的各类模式、经典测量理论以及项目反应理论,熟悉测评手段设计的基本原则;外语测评研究人员也要了解外语学习理论才能认清语言能力的发展,更科学地界定测评构念。4.外语测评与教材编制 在外语测评领域,“任务型语言测评”近年备受追捧。然而,“任务”并非测评领域独创,其理念主要来自教学与学习研究(韩宝成 2003)。外语教学和学习领域将任务视为教学或学习的基本单位(Drnyei 2002:137),测评领域也将任务看作测评的基本单位(Bachman&Dambck 2018:88),任务的重要性可见一斑。尽管不同领域对任务的定义略有
20、不同,但普遍认同任务构成的基本原则,如真实沟通情境(任务改自现实世界的语言使用)、沟952023 年 第 2 期通结果导向(评价任务完成表现,重点关注沟通目标是否达成,而非仅关注语言运用的准确性)、聚焦意义协商(强调运用语言去完成任务,而非单纯学习语言知识或技能)(Ellis 2019:12)。教材是连接教与学的重要纽带。授课时,教师往往直接选用教材中的任务。教材任务编制的质量直接关系到教与学的效果。Bachman&Palm-er(2010:28)认为教学任务和测评任务并无本质区别,其差异主要在于使用任务的目的。用于教学的任务旨在提升学生语言、认知、情感与社交等方面的能力,最终达到促学目的;用
21、于测评的任务意在采集学生完成任务的表现,以利正确决策。无论教学中的任务还是测评中的任务,都应反映真实语言沟通情境中任务的特征,因为“教”“学”“测”的最终目的是“用”。教材任务的质量越高,越有助于教师打通用、教、学、测间的藩篱。然而,如何编制优质的任务,人们并未形成共识。Bachman&Palmer(2010)提倡用“任务特征框架”(task characteristics framework)编制任务。任务特征框架原本为撰写测评规范(specifications)提供依据,同样可为教材任务编制提供有益参考。该框架由“背景特征”(如任务场景、参与者、目标)、“程序特征”(如任务完成时间、子任务
22、数量与关系)、“输入特征”(如输入材料的话题、信息传播形式、语言组构及语用特征)、“预期输出特征”(预期输出的语言组构及语用特征)、“输入与输出关系特征”等五大部分及其要素构成。教材研究者或编写者可依据该框架将教学任务、测评任务与现实世界语言使用任务进行比较,使教材中的任务不偏离现实语言使用,避免“两张皮”现象。5.外语测评与教师教育 外语教师专业素养始终是外语教师教育的重要研究内容。近年来,专业素养中的语言测评素养(language assessment literacy)成为外语测评以及教师教育等领域的新热点。语言测评素养源自教育学领域的测评素养概念,主要指将测评理论付诸于语言测评实践的知
23、识、技能、能力及观念(Fulcher 2012;Inbar-Lourie 2017)。外语教师对测评的认识与运用,直接影响教与学的动机与效果。遗憾的是,虽然频繁接触与使用测评,外语教师未必对其有透彻了解。教师及其他利益攸关者缺失测评素养的后果很可能是误用甚至滥用测评(何莲珍 2020),负面反拨效应由此产生。教师的教学能力固然重要,与之同样重要的还包括有效评价教学和学习效果的测评能力(孙海洋、熊洁 2020:75)。我国的语言测评素养研究大致分为两类:理论框架与体系构建、现状分析与需求调查(金艳 2018)。如何提升教师测评素养的实证研究在我国尚不多见。目前,提升教师测评素养的主要途径是短期培
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 外语 测评 教育 学科 中的 内涵 作用 罗凯洲
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。