基于英语学习者语料库的《中国英语能力等级量表》效度验证——以衔接知识运用能力量表为例.pdf
《基于英语学习者语料库的《中国英语能力等级量表》效度验证——以衔接知识运用能力量表为例.pdf》由会员分享,可在线阅读,更多相关《基于英语学习者语料库的《中国英语能力等级量表》效度验证——以衔接知识运用能力量表为例.pdf(10页珍藏版)》请在咨信网上搜索。
1、2023 年第 2 期外语测试与教学Foreign Language Testing and TeachingApr 2023中图分类号 H319 文献标识码 A 文章编号 2095-1167(2023)02-0029-10基于英语学习者语料库的中国英语能力等级量表效度验证 以衔接知识运用能力量表为例孔 文提要:作为一项新研制的语言能力量表,中国英语能力等级量表(CSE)由于其本身研制方法的局限,其效度有待在实践中验证。本文以中国英语能力等级量表衔接知识运用能力量表(CCS)为例,基于中国大学生英语语料库,运用 Coh-Metrix3.0 软件输出的 19 项衔接指标,采用定量分析方法,调查中
2、国英语学习者语篇衔接能力发展的丰富性和层级性,以验证 CSE 衔接知识运用能力分量表描述语的效度。关键词:中国英语能力等级量表;衔接知识运用能力量表;语篇衔接的丰富性和层级性;语言能力量表的效度验证Abstract:As a newly developed language proficiency scale,Chinas Standards of English Language Ability(CSE)needs to be validated due to the weakness of its development method.Taking the Cohesion Compete
3、nce Scale(CCS)of CSE as an example,this paper attempts to validate some descriptive statements in the CCS based on the English corpus of Chinese college learners with a quantitative method.To be more specific,the paper examines the diversity and hierarchy of Chinese English learners cohesion compete
4、nce development in constructing English texts with 19 indexes provided by the software Coh-Metrix3.0 to validate some descriptive statements in the CCS.Key words:Chinas Standards of English Language Ability;Cohesion Competence Scale(CCS);diversity and hierarchy of textual cohesion;validation of lang
5、uage proficiency scales1.引言中国英语能力等级量表(Chinas Standards of English Language Ability,CSE)于 2018 年由教育部和国家语委联合颁布,旨在为我国各教育阶段的英语学习、教学和测评提供共同参考框架,促进国内英语测评与国际标准对接和互认,提升外语教育体系的透明度(刘建达 2015;金艳,揭薇 2020)。学界围绕 CSE 已展开诸多研究,主要涉及 CSE 对各种测评的指导作用(潘鸣威,吴雪峰 2019;张晓艺,金艳 2019;杨志明 2018;王巍巍 2017)、各种考试与 CSE 对接的理论和实践探索(何莲珍 20
6、19;蔡宏文 2019;揭薇 2019;闵尚超 2019;张洁,王伟强 2019)以及CSE 在英语教学中的应用(刘建达 2019;王守仁 2018 等)。而量表的效度验证是一项长期复杂的工作,需要在使用中不断收集证据,逐步进行验证,因此 CSE 作为一项新研制的语言能力量表,其本身效度也有待不断验证(刘建达 2021)。92 基金项目:本研究为中国外语战略研究中心外教社“世界语言与文化研究”(项目编号:WYZL2022JS0001)和江苏省教育科学“十四五”规划课题(课题编号 D/2021/01/79)的阶段性成果。CSE 研制过程由描述语收集、分类和分级三个阶段组成(刘建达 2015):在
7、收集阶段,以国内现有课程标准、教学大纲、考试大纲及国内外语言能力标准为主要来源,少部分来自调研或自编;在分类和分级阶段,主要根据专家和教师的主观判断对描述语进行初步分类和分级,然后使用问卷调查全国师生的反馈,以此验证描述语的分类和分级,最后借助 Rasch 模型等统计手段锚定各个等级并对分级结果进行验证。究其根源,无论是在描述语的收集还是分类、分级阶段,量表编制的最终依据仍是专家或教师的主观经验和判断。毋庸置疑,专家或教师的主观经验和判断在量表编制过程中发挥着举足轻重的作用,但遗憾的是,量表在研制过程中并未参考中国英语学习者的真实语料,所描述的语言能力及其在不同等级的典型特征和代表性任务尚缺少
8、实证基础,因此量表能否客观、真实地反映出中国英语学习者语言能力发展的不同阶段及其区别性特征仍有待验证(李清华,孔烁 2020)。目前,一些学者已对 CSE 量表效度展开理论与实证研究(刘建达 2021;朱正才,曹艺 2020;金艳,揭薇 2020;何莲珍,陈大建 2017;方绪军,杨惠中 2017;朱正才 2016),但基于语料库验证 CSE 量表效度的实证研究尚不多见。为此,本文以 CSE 衔接知识运用能力量表(Cohesion Competence Scale,CCS)为例,基于中国大学生英语语料库,验证 CCS 部分描述语的效度,并为其进一步完善提供建议。2.研究过程2.1 CCS 衔接
9、知识运用能力量表解析CSE 对中国英语学习者衔接知识运用能力的描述共分三阶(基础、提高和熟练阶段)九级,总计 28 条描述语。描述语按具体内容可划分为两类:一类描述学习者运用衔接知识产出连贯语篇的能力,另一类描述学习者运用衔接知识理解语篇的能力,其中前者为量表描述语的重点,共有 21 条,后者仅有 7 条。本研究拟选取英语专业(以下简称英专)大二和大四学生英语作文作为语料,验证 CCS 描述语效度。之所以选取这两个年级学生作文作为研究对象,主要是因为 CSE 在描述语的分级验证阶段,问卷仅调查了英专大二和大四学生,这两个抽样年级可较好地代表英专学生英语能力发展不同阶段的区别性典型特征(刘建达,
10、彭川 2017)。由于该阶段学生的英语水平主要分布在五至九级,因此,本文重点调查五至九级中有关学习者运用衔接知识产出连贯语篇能力的描述语效度,此类描述语共计 12 条(见表 1)。表 1 CSE 衔接知识运用能力描述语(五至九级)级别描述语九级(1)能灵活运用丰富的衔接手段,使表达结构清晰,内容连贯八级(2)能就特定学术问题进行连贯合理的阐述和诠释(3)能熟练、得体地使用多种衔接手段,使内容表达连贯,符合逻辑七级(4)能使用表示文本逻辑和连贯发展的衔接手段,如先后、因果、对比(5)能使用连接词、代词等词汇衔接手段提高整个篇章的连贯性六级(6)能使用词汇衔接、省略等手段实现连贯表达(7)能恰当使
11、用多种句式结构使行文流畅,如省略句、并列句、复合句(8)能运用衔接手段表达段落之间的关系,如对比、原因、转折(9)能使用恰当的衔接手段,在语篇表达中转换话题或观点03外语测试与教学 2023 年第 2 期(续表)五级(10)能使用多种衔接手段,清晰连贯地组织口头话语或书面表达(11)能运用被动语态改变句子中的信息焦点,实现语义连贯(12)能运用衔接手段表示句子之间的关系,如比较、对比、因果、递进、转折等由表 1 可归纳出,CCS 描述语难度等级分布主要有 2 个依据:一是以衔接质量为等级划分依据,频繁出现的关键词有“多种、恰当、熟练、得体、灵活、丰富”,具体表现为随着英语水平的提高,学习者从能
12、运用衔接手段(如五级第 12 条描述语)逐渐过渡到能使用多种衔接手段(如五级第 10 条描述语),然后再提高到能恰当使用多种衔接手段(如六级第 9 条和第 7 条描述语)以及能熟练、得体地运用多种衔接手段(如八级第 3 条描述语),最后提升到能灵活运用丰富的衔接手段(如九级第 1 条描述语);二是以衔接范围的层级性为等级划分依据,具体表现为随着英语水平的提高,学习者能从最初仅关注局部句间衔接(如五级第 12 条描述语),逐渐过渡到重视段间衔接(如六级第 8 条描述语),最后提升到关注整体篇章的衔接与连贯(如七级第 5 条描述语)。2.2 研究问题从前文已知,CCS 描述语难度等级的划分依据主要
13、有 2 个:一是衔接质量,具体体现为衔接手段的丰富性/多样性、灵活性/熟练性和得体性/恰当性;二是衔接范围的层级性,具体体现为关注的是局部还是整体衔接。衔接方式的丰富性和层级性可采用定量方法调查,但对其灵活性和得体性的调查目前还只能依靠专家、教师或其他读者的主观判断。本研究主要借助中国英语学习者语料库,运用 Coh-Metrix 软件输出的衔接指标,采用定量分析方法,调查中国英专学生运用衔接知识产出连贯语篇的能力发展的丰富性和层级性,以此验证 CCS 描述语的效度。从表 1 至少可推断出以下 2 项假设:H1 随着英语水平的提高,学生写作中的衔接手段更加丰富;H2 随着英语水平的提高,学生在写
14、作中从关注局部衔接逐渐过渡到整体衔接和连贯。为验证假设 1 和 2,可分别探究以下 2 个研究问题:(1)不同级别的学生在衔接手段的丰富性上是否存在显著差异?(2)不同级别的学生在衔接范围的层级性上是否存在显著差异?若高级别学生在不同类型衔接手段的使用频率上以及在整体衔接指标的使用频率上均显著高于低级别学生,那么 CCS 描述语难度等级划分的两个依据就是科学合理的,反之则需进一步优化和调整。2.3 语料来源本研究所用语料来自“中国学生英语口笔语语料库”(文秋芳等 2008),该库是我国第一个英专学生口笔语语料库,其中笔语库由 4 950 篇作文组成。我们从中有条件地抽取大四和大二学生作文各 3
15、0 篇,分别代表高、低水平组。抽取的条件是随机选取作文题目相同且长度均为 300 词左右的作文,主要目的是控制作文体裁、内容和长度等干扰因素对衔接使用能力检测结果的影响,作文题目为“Nowadays,more and more college students rent apartments and live outside campus.Is it appropriate?State your opinion about it”。2.4 研究方法首先,将 60 篇作文导入 Coh-Metrix3.0,该软件可对口头和书面文本的词汇、句法、语义、13基于英语学习者语料库的中国英语能力等级量表效
16、度验证衔接、文本易读性与可读性等多个方面的信息进行自动在线处理。Coh-Metrix3.0 共输出 106个指标,涵盖 11 个板块,其中输出的衔接与连贯指标主要包括连接词(connectives)、指称衔接(referential cohesion)和潜语义分析(Latent Semantic Analysis,LSA)。前两个指标是对文本表层衔接手段的统计,最后一个指标 LSA 则超越了对表层形式特征的依赖,通过采用数理统计、权值计算等方法对数据库中批量的文本进行处理与分析,构建文本之间、词语之间的潜在语义结构,即词语文本矩阵,然后采用数学中的奇异值分解(Singular Value De
17、composition)方法对该矩阵进行降维,利用降维后的矩阵构建潜在语义空间,从而提取文本或者词语之间的语义相似度信息,达到简化文本数据的目的(梁茂成 2006;江进林 2016)。本文根据研究问题共选取其中 6 个连接词指标、8 个指称衔接指标和 4 个 LSA 语义相似度指标。另外,在表 1 中五级第11 条描述语提到了该级别的学生“能运用被动语态改变句子中的信息焦点,实现语义连贯”,说明能否运用被动语态同样是区分学生衔接能力等级的重要手段之一,因此我们将其使用频率也纳入统计指标。据此,每篇作文均有 19 个变量值,从不同角度探索文本的衔接和连贯性,变量类型和具体指标见表 2。表 2 C
18、oh-Metrix3.0 输出的与衔接和连贯性相关的主要变量与指标变量类型指标指标总数连接词所有连接词的比例转折连接词的比例因果连接词的比例时序连接词的比例逻辑连接词的比例附加连接词的比例6指称衔接相邻句子名词重叠的平均数所有句子名词重叠的平均数相邻句子论元重叠的平均数所有句子论元重叠的平均数相邻句子词干重叠的平均数所有句子词干重叠的平均数相邻句子实词重叠的平均数所有句子实词重叠的平均数8语义相似度相邻句子语义相似度的平均数相邻段落语义相似度的平均数段落内所有句子语义相似度的平均数所有句子语义相似度的平均数4被动语态被动语态的比例1需要说明的是,Coh-Metrix3.0 中的指称衔接与 Ha
19、lliday&Hasan(1976)定义的指称衔接不完全一致。后者中的指称衔接主要指借助代词、指示词、定冠词等进行语篇衔接,是语法衔接的一种表现形式,而 Coh-Metrix3.0 中的指称衔接主要通过计算名词、论元、词干和实词重叠的平均数,探求篇章内部的语义相关,包含了同指(co-referentiality)、同类(co-classification)和同延(co-extension)三种衔接关系。笔者利用 SPSS17.0 中的非参数独立双样本检验(Mann-Whitney Test),对大四和大二年级学生作文中反映其衔接和连贯性的 19 个指标进行差异显著性检验。3.结果与分析3.1
20、研究问题一两个水平组使用不同类别衔接手段的统计结果和检验结果分别如表 3 和表 4 所示。23外语测试与教学 2023 年第 2 期有关每个变量和指标的详细解释及计算方法可参看“Automated Evaluation of Text and Discourse with Coh-Metrix”一书(McNamera et al.2014)。表 3 两个水平组在连接词、指称衔接和语义相似度上的秩次统计表变量年级N秩均值秩和变量年级N秩均值秩和所有连接词大二3031.80954.00大四3029.20876.00总数60转折连接词大二3031.10933.00大四3029.90897.00总数6
21、0因果连接词大二3027.50825.00大四3033.501005.00总数60时序连接词大二3031.63949.00大四3029.37881.00总数60逻辑连接词大二3028.77863.00大四3032.23967.00总数60附加连接词大二3034.471034.00大四3026.53796.00总数60相邻句子名词重叠大二3023.97719.00大四3037.031111.00总数60所有句子名词重叠大二3023.33700.00大四3037.671130.00总数60相邻句子论元重叠大二3028.97869.00大四3032.03961.00总数60所有句子论元重叠大二302
22、6.63799.00大四3034.371031.00总数60相邻句子词干重叠大二3024.57737.00大四3036.431093.00总数60所有句子词干重叠大二3023.70711.00大四3037.301119.00总数60相邻句子实词重叠大二3029.10873.00大四3031.90957.00总数60所有句子实词重叠大二3028.60858.00大四3032.40972.00总数60相邻句子语义相似度大二3026.28788.50大四3034.721041.50总数60相邻段落语义相似度大二3025.92777.50大四3035.081052.50总数60段内所有句子语义相似度大
23、二3026.15784.50大四3034.851045.50总数60所有句子语义相似度大二3028.03841.00大四3032.97989.00总数60被动语态大二3029870.00大四3032960.00总数6033基于英语学习者语料库的中国英语能力等级量表效度验证表 4 两个水平组在连接词、指称衔接和语义相似度上的秩次检验表aMann-Whitney UWilcoxon WZ渐近显著性(双侧)所有连接词411.000876.000-.577.564因果连接词360.000825.000-1.331.183逻辑连接词398.000863.000-.769.442转折连接词432.0008
24、97.000-.266.790时序连接词416.000881.000-.503.615附加连接词331.000796.000-1.759.079相邻句子名词重叠254.000719.000-2.899.004相邻句子论元重叠404.000869.000-.680.496相邻句子词干重叠272.000737.000-2.632.008相邻句子实词重叠408.000873.000-.621.535所有句子名词重叠235.000700.000-3.179.001所有句子论元重叠334.000799.000-1.715.086所有句子词干重叠246.000711.000-3.016.003所有句子实词
25、重叠393.000858.000-.843.399相邻句子语义相似度323.500788.500-1.870.061段内所有句子语义相似度319.500784.500-1.930.054相邻段落语义相似度312.500777.500-2.033.042所有句子语义相似度376.000841.000-1.094.274被动语态425.000870.000-.993.321a.分组变量:年级表 3 和表 4 统计与检验结果显示:在 19 个不同类别的衔接指标上,大四学生在 11 个指标的使用频率上均略高于大二学生,其中有 5 个指标存在显著差异。这些调查数据说明,总体而言,高水平组比低水平组学生能
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 中国英语能力等级量表 基于 英语 学习者 语料库 中国 能力 等级 量表 验证 衔接 知识 运用
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。