语料库方法在汉语第二语言习得研究中的应用研究.pdf
《语料库方法在汉语第二语言习得研究中的应用研究.pdf》由会员分享,可在线阅读,更多相关《语料库方法在汉语第二语言习得研究中的应用研究.pdf(11页珍藏版)》请在咨信网上搜索。
1、87语料库语言学 2023年 第10卷 第1期语料库方法在汉语第二语言 习得研究中的应用研究*安徽大学彭家法 孙梦馨提要:本文对国内中文核心期刊论文中汉语二语习得语料库方法的使用情况进行了梳理,就汉语二语习得语料库方法的发展历程、研究现状、作用和局限等问题作了探讨,评述了当前汉语二语习得研究中语料库方法的发展和不足。分析结果显示:(1)语料库方法的发展历程主要分为起步期、发展期和飞跃期三个阶段,目前是该方法使用的飞跃期;(2)该方法近些年在语料收集、偏误分析研究方面有理论和应用的发展,但在用例分析、习得顺序研究等方面仍没有发挥出应用价值,仍存在着用例分析不全面、习得顺序研究数量不足、方法单一、
2、过程不完整等问题;(3)该方法具有反映中介语全貌等两点优势以及在应用中存在着研究内容不平衡等两点不足。针对语料库方法应用于汉语二语习得研究所存在的问题,本文进行了相关的解释分析,提供了解决问题的途径,并展望该研究方法的发展前景。关键词:语料库方法、汉语二语习得、偏误分析、正确用例、习得顺序1引言语料库方法是二语习得研究中一种常用的定量研究方法,它依托语料库中大量真实的母语或学习者语料,通过对语料样本的统计分析,总结母语或学习者语言的使用特征或情况,归纳语言运用的规律。近些年,有不少学者对语料库方法作了总结。冯丽萍、孙红娟(2010)指出语料库分析是习得顺序研究常用的一种方法。张宝林(2011)
3、详细说明了语料库对汉语二语习得研究的重要性,提出大规模语料能保证研究结论具有客观性和普遍性。毕晋等(2017)基于4种国内核心期刊,统计概述了汉语二语习得研究中语料库方法的应用领域和使用频率,并对中介语研究语料来源作了分类。曹贤文(2020)总结了语料库方法应用于汉语二语习得研究时主要采用“偏误分析”“频率分析”和“中介语对比分析”3种分析方法。虽然前人对语料库方法的应用进行了很好的总结,但是仍存在着一些不足。他们缺少对该方法在应用中取得的发展和存在的问题的总结。语料库方法是目前汉语二语习得研究中常用的量化研究方*孙梦馨为本文通讯作者。作者贡献:彭家法:选题构思、研究方法、讨论结论、字数占比(
4、20%)、修改润色;孙梦馨:数据收集、数据分析、讨论结论、初稿撰写、字数占比(80%)。SJ00088718语料库语言学2023第19辑正文.indd 878/18/23 5:20 PM88语料库方法在汉语第二语言习得研究中的应用研究 法,它能客观反映母语和二语习得者语言使用情况,并且其提供的庞大样本使得研究结论具有较高的可信度和科学性,极大促进了语言特征方面的研究。梳理总结语料库方法近些年取得的发展和现存的不足,有助于研究人员更深入地了解该研究方法的使用条件、应用领域等,从而能在习得研究中选择更合适的研究方法,得出更准确的结论。本文将以张宝林(2011,2021)等的理论说明为依据,结合相关
5、论文,梳理语料库方法在汉语二语习得研究中的使用情况。第一节为引言部分,主要介绍什么是语料库方法以及本文的研究意义。第二节对该方法的发展历程作了阶段划分,总结不同阶段该研究方法在各研究领域的应用情况。第三节总结其在语料收集方面取得的进展。第四节分析总结该方法在偏误分析领域的应用成果。第五节考察该方法在用例分析和习得顺序研究中的使用情况,发现其在这两个研究方面目前存在用例分析不全面、习得顺序研究数量不足、方法单一、过程不完整等问题,并针对上述问题进行了解释。最后的结语部分总结语料库方法的优势和局限,针对其局限性提供相应建议以供研究人员参考,并对语料库方法的发展前景作一展望。2 发展历程与现状分析我
6、们筛选出了19842021年世界汉语教学 语言文字应用 语言教学与研究 汉语学习中与汉语二语习得研究相关的论文128篇1,其中运用语料库方法的共计62篇。施家炜(2006)对二语习得研究领域作了细致分类,共分为“学习者语言特征研究”“学习者外部因素研究”“学习者内部习得机制研究”和“学习者研究”四大类,其中每大类下还包含如“偏误分析”“习得顺序”等12小类。他指出,国内汉语二语习得研究大部分只集中于学习者语言特征研究领域,其他领域鲜少涉及。因此,我们以语料库方法应用的研究领域为主要分期依据,结合语料库建设情况,从历时和共时层面对语料库方法的发展历程作一划分。语料库方法主要可以分为起步期、发展期
7、和飞跃期三个阶段。20世纪90年代中期至2004年是该方法的起步期,这一阶段,国内中介语语料库陆续建成,为语料库方法的使用提供了条件。该时期发文数量并不多,仅有6篇,研究的主题都是学习者语言特征领域。偏误分析相关文献共有3篇,比如陈小荷(1996)根据中介语语料库对留学生使用副词“也”的情况进行了偏误分析;习得顺序研究如王建勤(1997)借助中介语语料库对留学生习得“不”和“没”否定结构的顺序进行了考察。1 我们选择这四种期刊有两方面原因:其一是这四种期刊一直是CSSCI来源期刊;其二是这些期刊都刊发了较多与汉语二语习得研究、教学相关的论文。我们从1984年开始统计是因为汉语二语习得研究以鲁健
8、骥(1994)引入“偏误”和“中介语”概念为开端;以2021年结尾是因为本文撰稿时期为2022年初。SJ00088718语料库语言学2023第19辑正文.indd 888/18/23 5:20 PM89彭家法 孙梦馨20052012年是该方法的发展期,语料库建设加速发展,CCL语料库、HSK动态作文语料库等相继投入使用。该阶段发文数量有20篇,研究主题开始涉及内部习得机制,比如黄月圆等(2005)依据中介语语料库,通过考察留学生汉语反身代词“自己”的习得情况,证实了普遍语法和母语会影响成人的二语习得。除了偏误分析外,习得顺序也逐渐成为研究热点,共有7篇文献进行了探究,如周小兵、邓小宁(2009
9、)和谢福(2010)等。20132021年是该方法使用的飞跃期,语料库建设取得了长足进步,HSK动态作文语料库不断更新完善,BCC语料库、全球汉语中介语语料库也相继建成并得到充分使用。这一阶段的发文数量达到了36篇,除了学习者语言特征领域外,内部习得机制领域也成了研究热点,共有6篇相关文献,比如蔡淑美、施春宏(2014)和刘旭(2018)等。学习者外部因素领域也出现了相关研究论文,比如程燕、肖奚强(2020)借助语料库考察留学生四字成语的输出和输入情况,证实了课堂教学、目的语环境和输入频率等会影响留学生的习得情况。根据张宝林(2011,2021)对应用语料库方法的理论说明以及相关论文的分析,我
10、们归纳出该研究方法在语料收集、偏误分析、用例分析、习得顺序研究等方面应用时应注意的事项。语料收集包括语料收集方法和语料筛选;偏误分析包括偏误类型的归纳和偏误原因分析;用例分析涉及正确用例的分析和用例类型的归纳;习得顺序研究涉及方法选择、原因解释的问题。从62篇论文中语料库方法的使用情况来看,现有文献在语料收集、偏误分析领域做得相对较好;而在用例分析、习得顺序研究方面仍存在不足,比如存在缺少正确用例分析和用例类型归纳、习得顺序研究数量不足、研究方法单一、缺少原因解释等问题。下面我们将具体介绍语料库方法在使用上的发展和存在的问题,并针对不足之处给出相应的原因解释及建议。3 汉语第二语言习得语料收集
11、现有文献在语料收集和语料筛选方面做得较好。语料收集方法科学、多元,语料筛选也有相应的标准。毕晋等(2017)将中介语研究语料来源分成“经验式语料”“跟踪式语料”和“语料库语料”。我们依据前人的理论,结合筛选出的与汉语二语习得研究相关的128篇论文,将汉语二语习得研究语料的收集方法分为教学实践法、内省法和语料库法。从20世纪80年代开始,教学实践法就已经运用于汉语二语习得研究了,比如汪宗虎(1985)收集了教学中留学生词语运用出现的偏误,并展开分析。而随着汉语中介语语料库、现代汉语语料库的建成和普及,汉语二语习得研究在20世纪90年代末陆续出现使用语料库进行语料收集的方法,主要有两种方式,一种是
12、SJ00088718语料库语言学2023第19辑正文.indd 898/18/23 5:20 PM90语料库方法在汉语第二语言习得研究中的应用研究 通过字符串检索的方式直接提取语料,即“语句检索提取”方式;另一种是通过全篇阅读、手动查找的方式提取语料,即“篇章手动提取”方式。篇章手动提取指的是当所需要的语料无法用字符串的形式进行检索时,研究人员会阅读全篇语料,从中手动提取相关的语句。比如李榕、王元鑫(2021)在考察留学生第三人称回指习得情况时,从中介语语料库中筛选出128篇留学生作文,然后通过人工阅读全篇的方式挑选出含有第三人称回指的句子。进入21世纪以来,有些学者从生成语法视角出发研究汉语
13、二语习得,他们多通过内省法获得汉语本体研究的语料,比如袁博平(2017)等,虽然是依靠个人语感造出的句子,但也保证了语料的自然流畅。检索出结果后,需要对语料进行筛选。在语料的筛选方面现有研究都做得较好。我们根据张宝林(2011,2021)的有关理论和上文选取的期刊论文,归纳了几个筛选语料的方法。首先,要注意检索出的内容是否符合要求。张宝林(2021)指出,由于目前的语料库检索都是形式检索,因此会出现许多“与信息内容相关,但并非是需要查找的内容”,这时候就需要我们仔细甄别。其次,在偏误研究时,还要注意将句子和语段结合,比如张宝林(2010)就曾举“把”字句泛化的例子来说明。最后,我们选取语料作为
14、例句时,一般先从中国文学作品中选取,因为其表达更符合汉语母语者语感。但是并非所有中国文学作品中的语言表达都是自然、通顺的,这时就需要我们注意甄别语句的通顺与否。如果实在找不到符合要求的中国文学作品语料,可以从外国文学作品中寻找,但需要确保其译文水平尽可能接近自然汉语的水平。4 汉语第二语言习得偏误分析目前语料库方法在偏误分析研究方面做得较好。偏误类型方面,现阶段大多数文献都能采用定量分析的方法,依据学习者语料对偏误类型进行划分统计;偏误原因分析普遍较为详细,且原因分类更加多样。但是依然存在着一些不足:偏误类型归纳方面仍有少数文献直接套用前人的类型归纳结果;偏误原因分析方面仍有少数文献分析太过笼
15、统。在对外汉语教学研究中,鲁健骥(1994)归纳出了遗漏(回避)、误加、误代、错序四种偏误类型。但在实际研究中,我们应该根据学习者偏误语料归纳偏误类型,而不是直接沿用上述结论。张宝林(2011)曾指出,既往偏误分析相关研究几乎都沿用了这四种分类,这就使得研究缺乏针对性和个性化,失去了意义。根据对论文的梳理,我们共筛选出了33篇涉及语料库方法和偏误分析的文献,其中有23篇文献都比较符合我们对偏误类型归纳的要求,前两个阶段有10篇,现阶段有13篇。这些文献都采用不同方法或者从不同角度,归纳出新的偏误类型或给出更细致的下位分类,比如陈小荷(1996)按照偏误发生的语境条件把副词“也”SJ000887
16、18语料库语言学2023第19辑正文.indd 908/18/23 5:20 PM91彭家法 孙梦馨出现的语序偏误分成“也在主语前”等三种详细的下位类别;周小兵、邓小宁(2009)采用“显性偏误”和“隐性偏误”的分类方法对含“得”字的两种补语句偏误语料进行归纳分类;蔡淑美、施春宏(2014)从“语块配位方式”角度将二价名词习得的偏误分为“隔开式”“框架式”“话题式”等类型。不过目前偏误类型归纳研究方面也仍然存在着尚未完全摆脱套用结论的问题。现阶段与偏误类型归纳相关的论文研究共有17篇,我们发现仍然有一小部分论文(4篇)间接或直接沿用鲁健骥(1994)的四种偏误类型。比如牛长伟、李君(2019)
17、在讨论“什么”类代词的偏误类型时,直接依据鲁健骥的分类将“什么”类偏误语料归纳为“副词遗漏”“代词误代”“副词误代”“标点误代”四种类型,且每一类的偏误占比也并没有都统计展现出来。从偏误类型归纳的方法上来看,现阶段研究较前两个阶段有所发展,普遍更重视运用定量分析。前两个阶段的偏误类型归纳总体上缺少量化统计,大部分文献都只是举例说明某类偏误类型的表现,并未统计该偏误类型在留学生总偏误语料中的占比,无法推知这样的类型是否具有普遍性,比如崔希亮(2005)。张宝林(2011)指出,二语习得相关研究应采用定量和定性相结合的方法,尤其注重定量分析,这样可以保证研究具有最大限度的客观性和较强的说服力。如果
18、只是通过定性的方法主观判断偏误类型,或者依据极少甚至是单个样本划分出偏误类型,我们很难确定该结论是否具有普遍性,也无法从各偏误类型的占比中知道留学生的习得难点是什么。而在现阶段的研究中,研究人员都采用定量分析的方法研究偏误类型。比如蔡淑美、施春宏(2014)用定量分析的方法对留学生习得二价名词出现的偏误类型进行划分,并统计了每一类偏误在总偏误数中的占比,发现“框架式偏误”是留学生习得的难点。在偏误原因分析方面,应避免过于笼统的分析。张宝林(2011)指出,在分析偏误原因时,我们应该具体深入。我们筛选统计了涉及偏误原因分析的28篇文献,发现现阶段的偏误原因分析较前两个阶段更加详细,且原因分类更加
19、多样。前两个阶段共有14篇文献进行了偏误原因分析,其中有6篇文献对原因的解释相对充分,比如高立群(2001)从认知策略和教学过程两方面解释留学生在不成字部件构成的汉字上错误率高的原因。剩下8篇的偏误原因分析则较为笼统,比如崔希亮(2005)只是简单用“母语影响”一句话解释留学生介词结构出现的位置不当偏误,并未作详细分析。现阶段涉及偏误原因分析的文献也有14篇,其中对原因有详细解释的有11篇,并且多数文献尝试从新的角度进行偏误原因分析。比如李榕、王元鑫(2021)从“语言共性知识干扰”和句子的“完形”心理认知角度对韩语为母语的汉语二语学习者出现的第三人称代词回指“过度使用”偏误进行解释。但目前仍
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 语料库 方法 汉语 第二语言 习得 研究 中的 应用
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。