技术赋能下的术语翻译与术语管理——以中华学术外译项目《论中国乡村变迁》的英译为例.pdf
《技术赋能下的术语翻译与术语管理——以中华学术外译项目《论中国乡村变迁》的英译为例.pdf》由会员分享,可在线阅读,更多相关《技术赋能下的术语翻译与术语管理——以中华学术外译项目《论中国乡村变迁》的英译为例.pdf(10页珍藏版)》请在咨信网上搜索。
1、技 术 方 法技术赋能下的术语翻译与术语管理 以中华学术外译项目论中国乡村变迁的英译为例龙昱琼1 周小玲2(1.湘潭理工学院,湖南湘潭 411100;2.华南师范大学,广东广州 510631)摘 要:迅猛发展的语言智能技术及工具有助于提升大型翻译项目中术语的翻译质量和管理效率。文章以中华学术外译项目论中国乡村变迁的英译为例,探讨利用语料库技术、CAT 技术和 ChatGPT 解决人工识别术语效率低、术语预翻译结果不佳、管理效率不高的问题。文章设计并实施了基于 Sketch Engine、云译客和 ChatGPT 的术语翻译及管理流程,较为快速、准确地整理了高频术语表,创建了双语术语库并实现了术
2、语存储、检索、维护及分享。结果显示,Sketch Engine 术语自动识别功能的精确率达到约 69.35%;云译客平台的智能化程度高,使用简单流畅;ChatGPT 在辅助术语的译后编辑过程中能快速提供专业知识、背景信息及翻译建议等。可见,所提出的流程能有效地提升术语的翻译质量和管理效率。关键词:术语翻译;术语管理;翻译技术;论中国乡村变迁;语言智能工具中图分类号:H059;H083 文献标识码:A DOI:10.12339/j.issn.1673-8578.2024.02.007Exploration of Technology-enabled Terminology Translation
3、 and Management:A Case Study on Chinese Academic Translation Project of“C-E Translation of The Transformation of Rural China”/LONG Yu-qiong,ZHOU XiaolingAbstract:Language intelligence technologies and tools can help improve translation quality and management efficiency of terminology in large-scale
4、translation projects.Taking the Chinese Academic Translation Project“C-E Translation of The Transformation of Rural China”as an example,we address such problems as low efficiency of manual term recognition,poor pre-translation results and low management efficiency of terms with corpus technology,CAT
5、 technology and ChatGPT.Through a term translation and management process based on Sketch Engine,POWER ECHO and ChatGPT,high-frequency term lists of the book The Transformation of Rural China are extracted and sorted out,a bilingual term database is established efficiently,and the storage,retrieval,
6、maintenance and sharing of terms are achieved.Our results show that the precision of automatic recognition function of Sketch Engine is about 69.35%,POWER ECHO platform is relatively user-friendly and smart,and ChatGPT can quickly provide professional knowledge,back-ground information and translatio
7、n suggestions in post-editing.These results show the process can significantly improve the translation quality and management efficiency of terms.Keywords:terminology translation;terminology management;translation technology;The Transformation of Rural China;language intelligence technology收稿日期:2023
8、-07-21 修回日期:2023-10-12基金项目:国家社会科学基金中华学术外译项目“论中国乡村变迁的英译(21WSHB004)”;上海外国语大学习近平谈治国理政多语种数据库综合平台在外语教学与科研中的应用(2022-IG-G0008)在大型翻译项目中,专有名词、专业术语、特色表达等都有其特定的专业背景或语言风格,且规模一般较大。这对术语的翻译和管理提出了更高的要求。因此,如何保证大型翻译项目中的术语翻译质量及术语管理效率是值得探究的问题。随着语言智能技术的飞速发展,丰富的术语库及语料库平台、智能在线翻译平台和大语言模型能帮助译者大幅提升术语翻译质量及管理效率,具体而言可实现术语自动识别、整
9、理、翻译、质检、存储、检索及维护,提高语言资产的复用率,使整个术语翻译和管94中国科技术语/2024 年 第 26 卷 第 2 期理流程规范化。基于此,本研究依托中华学术外译项目“论中国乡村变迁的英译”,探究如何借助语料库平台 Sketch Engine、在线翻译平台云译客和聊天型人工智能助手 ChatGPT 提升术语翻译质量及管理效率,并讨论所出现的问题。文章首先提出术语翻译与管理的基本概念和实施流程,之后对结果及局限性进行分析。1 术语翻译和术语管理的基本概念与步骤术语是各门学科中的专门用语。术语可以是词,也可以是词组,用来正确标记生产技术、科学、艺术、社会生活等各个专门领域中的事物、现象
10、、特性、关系和过程。根据术语与专业领域之间的关联以及使用范围的差异,可以将术语分为纯术语、一般术语、准术语三个类别1。纯术语的专业性最强,使用范围较小,一般为专业研究人员所使用。一般术语专业性则相对于纯术语较弱,是各领域的基本术语。准术语的专业性最弱。在科技普及的今天,准术语在日常生活中随处可见。本文使用上述的术语概念提取了论中国乡村变迁一书中的术语,将书中专业性较强的专业术语归为纯术语,如“宅基地”“集体经营性建设用地”“城镇化率”“确权到户”“资格权”“资源要素”等;将专有名词和常见的专业术语等归为一般术语,如“恩格斯”“马克思”“小康社会”“承包权”“德意志意识形态”等;将固定词语、短语
11、归为专业性较弱的准术语,如“生产力”“资本主义”“社会主义”“工业化”等。需要说明的是,纯术语、一般术语和准术语三个概念的含义在不同的上下文中会有所变化,所以这三个概念的界定较为模糊,或有重叠。术语管理是为了满足某种目的而对术语资源进行管理的实践活动,通常包括术语的收集、描述、处理、存储、编辑、呈现、搜索、维护和分享等2。翻译协作中的术语管理活动覆盖了译前、译中、译后三个阶段。译前包括术语提取、翻译、术语库创建等工作;译中需术语匹配、识别和添加新术语;译后需对术语进行备份及维护3。2 术语翻译和术语管理研究现状翻译学界对外译项目中的术语研究集中在以下两个方面。一方面,学者们对术语翻译进行了探讨
12、,如术语翻译策略、问题及难点、术语翻译概念及特征等。黄鑫宇、魏向清4从认知术语学视角出发,提出了中华思想文化核心术语翻译的概念建构模型。有学者从术语翻译特征出发,探讨了文化术语翻译的实践理性及有效性原则5。另一方面,国内学界对术语规范化的研究也日益增加。余静6讨论了翻译策略中术语的规范问题,并提出术语关联的解决思路。在文化外译的术语翻译规范方面,学者们主要探讨了法律文化术语的译名统一与规范化7、中医药名称的术语规范化8-9及文化外译的术语规范化研究概况10。术语自动提取可以采用基于规则11的方法,如基于构词特点、句法特点以及领域特点自动提取术语,从语料中抽取匹配模板的词语。基于数理统计的方法主
13、要为统计量计算和机器学习方法。基于统计量的方法通过计算词频、互信息12、TF-IDF等统计量来提取术语,具有通用性。基于机器学习13-14的方法主要是利用已标注的大规模语料训练模型,通过模型预测未标注的语料,将术语抽取问题转为序列标注问题或分类问题。随着机器学习技术的发展,支持向量机(SVM)、深度学习等方法开始用于训练模型并进行术语识别。这些方法可以捕捉语义关系,更好地理解术语的上下文语境。如李贞贞等提出了基于深度学习和统计信息的术语抽取方法15。一些学者还结合多种方法提取术语,如基于词性(POS)模式规则、语料库比较和改进 TF-IDF 权重的方法16、SRP-TF-IDF 模型17以及基
14、于术语的语言特征和复合测量方法的提取方式 18。而中文术语识别因中文字符密度高、词汇复杂的特点正面临特定的挑战。研究者在中文术语识别方面探索了基于字19、词20和基于字词混合21-22 的方法。在术语管理方面,ISO(国际标准化组织)和NISO(美国国家信息标准化组织)为术语标准化做出了突出贡献。ISO 制定的相关国际标准包括 ISO 05技 术 方 法704、ISO 1087、ISO 12620 标准,涵盖术语的编写和组织、定义、术语数据库等方面的信息。NISO 制定的 NISO Z39.19、NISO RP-8、NISO RP-9 标准分别提供了信息科学术语标准、数字化图书馆术语标准化、资
15、源描述方面的指南。常用的术语管理工具主要 有 SDL MultiTerm、TermWeb、Wordbee Term、FluTerm、OmegaT 和 TaaS 等。在技术应用方面,国内学者为推动中国外译项目的发展,尝试将现代技术与外译项目相结合。柳菁提出了敦煌文化术语库的建设,设计了“敦煌文化术语编纂平台”23。刘润泽、丁洁、刘凯则探讨了中国特色术语库的标准化建设问题,分析其背后的实践逻辑,并提出未来研究工作的新方向与新方法24。同时,语言服务行业中的术语管理流程、工具等2,25、翻译协作中的术语管理3,26及术语归类管理27等问题也受到了关注。不过,国内对于中华学术外译项目这类大型翻译项目中
16、的术语翻译及管理的研究较为欠缺。本文结合现代技术,将多种简单易用的在线网络平台和工具融入论中国乡村变迁的英译实践中,设计并实施术语翻译及管理流程,帮助翻译人员解决人工识别术语效率低、术语预翻译结果不佳、管理效率不高的问题。3 论中国乡村变迁英译项目中的术语翻译和管理流程 高效规范的术语翻译和管理流程能保证大型翻译项目中术语翻译的准确性、一致性及术语管理效率。论中国乡村变迁英译项目组共 6 人,包括项目负责人 1 名、工程技术人员 1 名、译者 3 名和外国审校专家 1 名,其中术语预翻译由机器翻译引擎实现,术语译后编辑由译者完成,术语管理中的技术问题由技术人员负责。针对该英译项目前期出现的人工
17、识别术语效率低、部分术语预翻译结果不佳、管理效率不高的问题,本文提出了基于Sketch Engine、云译客和 ChatGPT 的术语翻译及管理流程。其中 Sketch Engine 是由语料库专家 Adam Kilgariff 设计的词典编纂辅助系统。该系统利用自然语言处理技术对包含数十亿个单词的真实文本(文本语料库)进行分析,能识别出词汇及表达的常见含义和用法等相关信息。目前,Sketch Engine中包含了 500 个现成可用的语料库,支持 90 多种语言,已被广泛运用于词典编纂、语言学习、机器翻译、文本挖掘应用程序等诸多领域。Sketch Engine的功能主要包括词语速描(Word
18、 Sketch)、关键词提取(Keywords)、索引(Concordance)、网页搜索(Web Search)。云译客是一款在线翻译平台,大部分功能可以免费使用,为译员和翻译团体提供了实时的人机共译智能翻译协作环境。ChatGPT 是由OpenAI 开 发 的 一 种 基 于 GPT(Generative Pre-trained Transformer)模型的对话系统。通过人机对话的方式,ChatGPT 可完成多语种翻译、语法纠错等多项语言生成任务28。整个流程包括译前、译中和译后三个阶段,见表 1。译前阶段,项目组需要创建双语术语库,该任务分为三步完成:第一步,将全书处理为纯文本格式文件
19、,按章节进行拆分,将每章节的纯文本文件导入 Sketch Engine,创建为目标语料库。使用Sketch Engine 的“Keywords”功能进行术语的自动识别。需要说明的是,该功能先将目标语料库中的纯文本进行预处理,如分词、使用 Stanford NLP 进行词性标注、语法解析等。通过比较目标语料库和参考语料库 zhTenTen17 Simplified 中符合中文语法的结构的出现频率,识别出频率较高的词汇或短语作为术语29。zhTenTen17 Simplified 语料库共 135 亿词,涵盖各种网站、话题和文本类型的网络信息。使用“Concordance”功能可以查看术语的上下文
20、,在ChatGPT 的辅助下确定术语含义,进行人工整理。接着将单语种术语表导入云译客平台。第二步,使用云译客的“机器预翻译”功能,进行术语预翻译。借助 ChatGPT 获取专业知识,进行近义词辨析,查询背景信息和获得翻译建议等,对术语预翻译结果进行译后编辑。第三步,使用云译客“GPT 质检”功能进行质检,使用“语言资产”功能存储术语对。在译中阶段,翻译平台自动匹配术语,提供术语对。项目组成员可检索术语、修改术语、添加新术语并备注。在译后阶段,技术人员对术语库进行备份、维护、分享,甚至协作共建术语库。15中国科技术语/2024 年 第 26 卷 第 2 期表 1 论中国乡村变迁英译项目术语翻译及
21、管理流程译前阶段译中阶段译后阶段操作所用到的工具及其功能操作所用到的工具及其功能操作所用到的工具及其功能自动识别Sketch Engine 的“Key-words”功能检索云译客“语言资产”和“术语语料检索”备份云译 客“语 言 资产”人工整理Sketch Engine 的“Concordance”功能和 ChatGPT预翻译云译客“机器预翻译”译后编辑云译客“个人/团队翻译”和 ChatGPT质检云译客“GPT 质检”功能存储云译客“语言资产”修改添加备注云译客“个人/团队翻译”或“语 言 资 产”及“术语库”维护云译客“个人/团队翻译”分享共建云译 客“语 言 资产”“术语语料库”“协作共
22、建”术语翻译及管理流程的主要工具及作用如图1 所示,其中使用 Sketch Engine 自动识别和整理术语与使用云译客平台进行术语预翻译、译后编辑、质检、存储、检索、维护及分享是主流程。而通过ChatGPT 获取专业知识,进行近义词辨析,查询背景信息及获取翻译建议等则贯穿于整个流程。图 1 论中国乡村变迁英译项目术语翻译及管理流程图4 论中国乡村变迁英译项目中的术语翻译及管理流程实施结果分析 项目组首先将论中国乡村变迁全书的纯文本导 入 Sketch Engine,创 建 为 一 个 语 料 库,从“CORPUS INFO”获取该语料库的统计数据见表 2。该语料库中共有2737 个句子,80
23、 782 个词,106 345个词符(包括词、标点符号和其他语言元素),8134个不同词性的词目,包含非单词的词共 7121 个,涵盖 9 种词性。基于上述流程,项目组在短时间内创建了包含 1387 个术语对的双语术语库。为评估该术语翻译及管理流程的可行性,下面对流程的实施结果进行分析讨论。表 2 语料库统计数据DimensionsCountstokens106 345words80 782sentences2737documents1lempos8134tag31word7121pos94.1 高频术语表及术语搭配高频术语是指出现频率较高的术语,通常用以表述书中的核心概念或主题。通过了解高频
24、术语,译者可大致知晓原书作者要传达的核心思想,这也为后续翻译打下基础。项目组首先使用 Sketch Engine 和 ChatGPT,整理出高频术语及其出现频次,如表 3、4 所示。由表3 可知,论中国乡村变迁一书主要讨论在城镇化及现代化进程中,经济体制改革、城乡融合发展、乡25技 术 方 法村振兴战略背景下的城乡关系、农村改革、乡村治理、乡村社会文化、农村土地及农民问题。每章中描述中国乡村变迁的侧重点有所不同,各章高频术语如表 4 所示。表 3 全书高频术语表术语频次术语频次术语频次乡村1090人民出版社240城镇化进程68城乡636乡村社会185重要文献选编68农民489城乡关系113乡村
25、文化55现代化486人民日报78现代化进程54社会主义337中国特色社会主义78农村土地52城镇化247社会主义现代化76城乡融合发展52进程241中央文献出版社75经济体制49邓小平191乡村振兴战略70社会变迁48工业化182小康社会69农村改革46变迁162乡村治理68城乡二元结构42表 4 各章高频术语表出处高频术语序言乡村、工业化、城镇化、振兴、变迁、乡村社会、现代化进程、乡村发展、城乡关系、乡村振兴战略、城乡融合发展、城乡发展不平衡、城乡二元结构、十九大第一章研判、振兴、城镇化进程、城乡关系、乡村社会、现实逻辑、共同繁荣、马克思主义发展史、文化观念、社会主义、路径、小康、良性互动第
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 论中国乡村变迁 技术 赋能下 术语 翻译 管理 中华 学术 项目 中国 乡村 变迁
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。