基于语料库的机器翻译句法简化研究——以中医药文本为例.pdf
《基于语料库的机器翻译句法简化研究——以中医药文本为例.pdf》由会员分享,可在线阅读,更多相关《基于语料库的机器翻译句法简化研究——以中医药文本为例.pdf(4页珍藏版)》请在咨信网上搜索。
1、 Tel:027-87158992ENGLISH SQUARE基于语料库的机器翻译句法简化研究以中医药文本为例 刘妍萌 摘 要 近年来机器翻译愈加普遍,而机器翻译的翻译共性问题仍有待探索。本文从翻译共性中的简化现象入手,以中医药文化宣传文本为例,探索机器翻译的翻译共性问题。基于自建中医药文化翻译语料库,本文对比了机器翻译文本与非翻译文本的句法特征,挖掘出机器翻译句法特征的构型特点。研究发现,在机器翻译中仅部分句法特征显示出简化趋势。本文是翻译共性在机器翻译领域的实践和延伸,在一定程度上有助于完善机器翻译工具,加强机器翻译在中国传统文化“走出去”中所起的作用。关键词 中医药文化;语料库;机器翻译
2、 中图分类号 H059文献标识码 A文章编号 1009-6167(2024)10-0040-04 1 研究背景机器翻译得益于成本低、速度快、效率高的优势,已逐渐被应用于各行各业。尤其是近年来随着计算机技术的不断革新,以百度翻译、有道翻译、谷歌翻译、DeepL、ChatGPT等为代表的机器翻译工具在准确率和流畅度上得到了进一步提升,成为与人工翻译并驾齐驱的一种翻译方式。与人工翻译相同,机器翻译的基本过程也是将源语信息用目的语表达出来,完成从源语到目的语的转换,减少不同语种人群之间的沟通障碍。经过语言转换过程,人工翻译和机器翻译均输出翻译语言(translated language)。“人工翻译语
3、言的语言规律,如翻译共性(translation universals),是否在机器翻译语言中仍然适用?”成为学界所关注的问题。本文从翻译共性中的简化现象入手,以大量实证数据为基础,探索不同机器翻译工具(谷歌翻译、DeepL、ChatGPT 3.5)所译的中医药汉译英文本与非翻译英语母语文本相比,在句法层面是否存在翻译共性,分析机器翻译共性的特点并解读其原因,验证与分析机器翻译的语言规律,以期帮助人们更加深刻、全面地理解翻译语言的特性,并为机器翻译工具的完善提供些许借鉴。2 翻译共性翻译共性指翻译作为一种语言,拥有其自己的特性。翻译共性的提出可追溯至英国翻译理论家贝克(Mona Baker)于
4、1993年发表的文章“Corpus Linguistics and Translation Studies:Implications and Applications”(Baker,1993)。翻译共性具有双重意义,一是翻译共性是基于统计的普适性语言规律,在大量实证样本中得到体现;二是翻译共性是翻译过程本身的结果,独立于源语语言和目的语语言的系统性差异(胡开宝,2011)。学者们利用语料库资源与工具,在不同语言、不同文体中验证翻译共性,并发现和归纳出简化(simplification)、显化(explicitation)、范化(normalization)等翻译语言共性特征(何丽玲,2020)
5、。方法上,研究者一般使用可比语料库(comparable corpora),对比翻译语料库和非翻译语料库的语言表征(linguistic indicators),找寻其语言构型(patterns),验证翻译共性。随着翻译共性的研究内容不断丰富,翻译共性的应用范围也不断扩大。在涉及语种上,研究从早期以印欧语系为主拓展到包括汉语在内的汉藏语系等(Xiao et al.,2015);在翻译文体上,学者们探索了文学、新闻等多个文体中的翻译共性趋势(Mauranen et al.,2004)。此外,有的研究还引入了译员翻译能作者简介:刘妍萌,博士,西北工业大学外国语学院副教授。研究方向:语料库翻译学、机
6、器翻译、医学翻译。收稿日期:2023-9-6412024年4月(总第262期)英语广场基金项目:2023年度陕西省哲学社会科学研究专项“后疫情时代基于语料库多元互证的陕西中医药文化外译策略研究”(编号2023QN0012);西安市2023年度社会科学规划基金项目“语言数据视角下西安中医药健康旅游外译研究”(编号23YZ09);西北工业大学中央高校基本科研业务费(社科)重点布局类(社科类)项目基金“基于语言数据多元分析的翻译质量动态评估研究”(编号23GH0306)。力等变量,探寻这些变量对翻译共性的影响(Redelinghuys et al.,2015)。这无疑从多角度丰富了翻译共性的研究内容
7、,也不断地完善了翻译共性的科学性和普适性。考虑到机器翻译与人工翻译同样经历了语言转换过程,理论上,机器翻译也应具备翻译共性特征。本文将翻译共性引入机器翻译并验证机器翻译语言的翻译共性,旨在进一步拓展翻译共性研究范围,以期借助翻译共性理论知识指导机器翻译工具优化。3 翻译简化翻译简化是指翻译语言相较于非翻译目的语语言(non-translations in target language)出现的语言简化倾向。学者们通过对比翻译语言和非翻译目的语语言中高频词(high frequency word)、词汇密度(lexical density)等语言表征来判断翻译语言的简化趋势(Laviosa-Br
8、iathwaithe,1998;于红,2016)。区别于显化、范化等其他翻译共性,简化在前人实证研究中较少遇到相左的学术意见(Mauranen et al.,2004)。这从侧面说明简化在不同语种和不同文体中更加稳定,也更具普适价值。因此,本文选取翻译共性中的简化作为研究突破口,探索机器翻译中的翻译共性问题。纵观前人研究,本文梳理出翻译简化研究的两个趋势。一是所研究的文本类型更加细化。早期学者们在研究翻译简化时所使用的语料大多分为文学、新闻、报告等(王克非 等,2008);而近年来,简化研究所分析的文本对象更加专业化,文本类型划分也更加细致,比如某学科的学术论文、某领域的专业文本等(孙艳 等,
9、2013)。二是语言表征更加多元。由于语言是一个复杂的整体,翻译简化应当体现在翻译文本的各个层面。近年来有关翻译简化研究的关注点开始从词汇层面向句法层面发展,简化的语言表征也从词汇特征扩展到句法特征(Liu et al.,2021)。这些研究趋势有助于更加细致、体系化地探索翻译简化现象,也为翻译共性理论的完善提供了更加丰富的实证支撑。因此,本文集中分析中医药文本的汉译英机器翻译在句法层面的简化现象,从文本类型和语言表征两方面拓展翻译共性研究。4 研究设计4.1 语料库建设笔者收集了80篇中医药文化介绍文本作为源语样本,并分别通过谷歌翻译、DeepL和ChatGPT 3.5三个机器翻译工具完成汉
10、译英翻译,形成机器翻译样本。同时,笔者在澳大利亚政府官方网站上收集了80篇有关医药卫生宣传的材料,作为非翻译英语母语样本。基于所收集的样本语料,笔者自建中医药机器翻译语料库(A库),下设四个子库,详见表1。表1 中医药机器翻译语料库基本情况中医药机器翻译语料库A库(102,317字)B库(24,724字)C库(25,988字)D库(25,547字)E库(26,058字)谷歌翻译DeepLChatGPT 3.5澳大利亚政府官网英语英语英语英语80个样本80个样本80个样本80个样本4.2 语言表征标注笔者使用Syntactic Complexity Analyser语料库工具(Lu,2010)对
11、所有语料的14个句法特征进行句法标注,并用Excel整理句法特征数据。句法特征包括:平均句长(Mean Length of Sentence,MLS)、平均从句长度(Mean Length of Clause,MLC)、平均T单元长度(Mean Length of T-unit,MLT)、从句/句子比(Clause per Sentence,C/S)、T单元/句子比(T-unit per Sentence,T/S)、从句/T单元比(Clause per T-unit,C/T)、复杂T单元/T单元比(Complex T-unit per T-unit,CT/T)从属从句/从句比(Dependen
12、t Clause per Clause,DC/C)、从属从句/T单元比(Dependent Clause per T-unit,DC/T)、并列短语/从句比(Coordinate Phrase per Clause,CP/C)、并列短语/T单元比(Coordinate Phrase per T-unit,CP/T)、复杂名词短语/从句比(Complex Nominal per Clause,CN/C)、复杂名词短语/T单元比(Complex Nominal per T-unit,CN/T)以及动词短语/T单元比(Verb Phrase per T-unit,VP/T)(孙艳 等,2013)。根
13、据这14个句法特征,我们可从句子单位长度(length of production unit)、句子复杂度(sentence complexity)、从属关系(subordination)、并列关系(coordination)、特殊句法结构(particular structure)五个维度分析文本的句法复杂度,详见表2。 Tel:027-87158992ENGLISH SQUARE表2 句法复杂度的五个维度句法维度句法特征句子单位长度MLC、MLS、MLT句子复杂度C/S从属关系C/T、CT/T、DC/C、DC/T并列关系CP/C、CP/T、T/S特殊句法结构CN/C、CN/T、VP/T4.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 语料库 机器翻译 句法 简化 研究 中医药 文本
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。