学术文本机器翻译错误探析—...神经机器翻译》(节选)为例_谢晓璐.pdf
《学术文本机器翻译错误探析—...神经机器翻译》(节选)为例_谢晓璐.pdf》由会员分享,可在线阅读,更多相关《学术文本机器翻译错误探析—...神经机器翻译》(节选)为例_谢晓璐.pdf(3页珍藏版)》请在咨信网上搜索。
1、文化传播1132023 年第 15 期学术文本机器翻译错误探析以 神经机器翻译(节选)为例谢晓璐(青岛大学 山东 青岛 266071)近年来,随着大数据、人工智能等技术的发展,机器翻译逐渐成为关注的焦点。机器翻译是“使用计算机系统将文本或语音从一种自然语言自动翻译为另一种语言”1。但机器翻译的质量无法让人满意,且在垂直领域仅依靠机器翻译难以产出高质量译文,因而译后编辑环节必不可少2。本文选取的原文本属于学术文本,学术著作属于科学语言,它的功能是记录科学活动和学术思想,科学活动和学术思想的显著特点是概括性和抽象性,因此,相对于其他文本来说,学术著作的翻译在学术性方面提出了很高的要求3。近几年机器
2、翻译越来越多地参与到学术文本的翻译过程中,相关研究也逐渐增多。因此运用计算机辅助翻译是翻译学术文本的一大趋势。笔者借助YiCAT 翻译平台,采用Tencent TranSmart 交互式机器翻译,以学术文本的机器翻译译文为例,总结学术文本机器翻译结果的高频错误,分析译文存在的问题并提出解决办法。一、文献综述国外对机器翻译质量研究已经有60多年的历史,例如:Garcia的Translating by post-editing:is it the way forward?Fiederer R和OBrien S的Quality and machine translation:A realistic
3、objective。国外学者对译后编辑的研究有近20多年的历史,主要针对英德、英法互译等。国内对该领域的研究也取得了一定的进展,例如:崔启亮、冯全功的译后编辑研究:焦点透析与发展趋势总结了译后编辑的研究现状,预测其趋势,为学界提供参考,但是,译后编辑在具体领域的应用研究鲜有谈及4,且机器翻译系统对不同文本给出的译文质量也存在差异。比较典型的研究有罗季美和李梅的机器翻译译文错误分析,李梅和朱锡明的英汉机译错误分类及数据统计分析 对汽车技术文献的英汉机器翻译错误进行【摘要】使用YiCAT 翻译平台中的机器翻译引擎将神经机器翻译 第一章的第一部分译成汉语,以此翻译结果为研究对象,总结出现频率较高的机
4、器翻译错误类型,如在词汇层面的术语翻译错误、多义词误译、词性错译,句法层面的语序错误、从句错译、欠译,篇章层面的缺少衔接和逻辑混乱问题,并在此基础上提出改进方法,对机器翻译错误提出解决对策,以期为今后学术文本机器翻译译后编辑研究提供借鉴。【关键词】学术文本;机器翻译;错误探析;译后编辑【中图分类号】H315 【文献标识码】A 【文章编号】2096-8264(2023)15-0113-03【DOI】10.20024/ki.CN42-1911/I.2023.15.036归类分析。从上述研究分析可以看出,目前对机器翻译学术文本的错误研究相对较少,本文将在对相关错误类型进行分析的基础上,提出相应的解决
5、办法,以期提高学术文本译后编辑的质量。二、理论基础:译后编辑译后编辑是“检查和修正机器翻译的输出”1,是指根据特定的目的对机器翻译的原始产出进行加工与修改的过程,包括更改翻译(语言)错误、提高机译产出的准确性与可读性等5。就目前机器翻译技术来说,自动翻译生成的译文质量对于参照原文进行理解一般还可以做到,但是还难以达到直接输出译文稿而无需人工润色的质量,所以后编辑处理在很多情况下必须使用6。三、机器翻译错误类型及分析本章着重分析使用YiCAT 翻译工具过程中遇到的机器翻译错误,主要从词汇、句法、语篇这三个层面阐述。(一)词汇层面1.术语翻译错误例1原文:Fluency also involves
6、 picking the right content words when there are several possible synonyms available.机器译文:流利还包括在有几个可能的同义词可用时选择正确的内容词。译后编辑:流畅性还包括在有很多同义词的情况下选择正确的实词。分析:学术文本中的术语较多,语义丰富,涉及的领域专业性较强,某些词汇既可以作为一般词汇又可以作为术语,而机器翻译系统有时难以辨别一般词汇和专业词汇。“content words”这个术语翻译错误,机器翻译没有采114今古文创用通用译法,机器译文不符合英文表达习惯,通过查询术语在线网(http:/),确定将该
7、术语译为“实词”,符合学术文本中术语翻译的准确性。2.多义词误译例2原文:Four score and seven years is not just any way to say 87 years.机器译文:四分七年不是随便说的 87 年。译后编辑:八十七年不是随便说的 87 年。分析:同一个单词或短语经常有多种理解,多义词识别是自然语言处理中一个较难解决的问题。这里score 不表示“分数”,而是“二十”的意思。译员在处理一词多义的问题时会根据上下文或具体语境选择恰当的含义,而机器翻译系统目前虽然具备一定的语境处理能力,但此例的语境有些难处理,原因在于score 作为“分数”义与years
8、都是名词,且前面都有数词,很容易理解为两个并列的名词结构,score 作为分数义,前面也多跟数词,对于机器翻译来说很难辨认,如此机器处理起来困难很大。由于计算机自身存在局限性,不能像人脑一样灵活思考,在结合具体语境对文章进行分析的能力上还不足,往往会选用出现次数最多的那个单词意思,不能选择恰当的表达,容易出错。3.词性错译例 3 原文:There is an extensive proliferation of tool kits available for research,development,and deployment of neural machine translation sy
9、stems.机器译文:可用于神经机器翻译系统的研究、开发和部署的工具包广泛扩散。译后编辑:有大量的工具包可用于神经机器翻译系统的研究、开发和部署。分析:在英译汉的过程中,我们一般会遵循汉语动词优势,将英语中的名词或名词词组译为汉语中的动词,但这要视情况而定,在翻译某些词汇时须保留其本来的词性。此例中,proliferation 作为名词有“扩散、激增、大量的事物”等含义,在短语a proliferation of 中意为“大量的”,而机器在处理该情况时无法辨别,从而错译。此处仍需将proliferation 看作名词短语中的一部分,不改变词性来翻译。(二)句法层面1.语序错误例4原文:The
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 学术 文本 机器翻译 错误 探析 神经 节选 谢晓璐
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。