ChatGTP与中国语言学的未来_吴礼权.pdf
《ChatGTP与中国语言学的未来_吴礼权.pdf》由会员分享,可在线阅读,更多相关《ChatGTP与中国语言学的未来_吴礼权.pdf(11页珍藏版)》请在咨信网上搜索。
1、第 卷 第 期 年 月北华大学学报(社会科学版)().语文现代化:语言技术应用与语言本体研究 与中国语言学的未来吴礼权摘 要 作为一种人工智能技术驱动的自然语言处理工具,目前已经具备一定的理解和学习人类语言的能力,能跟人类互动聊天,甚至还能完成论文写作等复杂任务,因而引发了包括学术界在内的社会各界的广泛关注与热烈讨论。作为一种人工智能技术驱动的自然语言处理工具,不管它目前的技术水平如何,能完成哪些超乎想象的工作;未来将会发展到什么程度,可以肯定的是,它对中国语言学的研究与教学定会产生深刻的影响。就发展前景而言,具有较强应用性,但也不是万能的,有其自身局限性。关键词;人工智能;自然语言处理;中国
2、语言学中图分类号;文献标识码 文章编号()收稿日期 .作者简介 吴礼权,复旦大学中国语言文学研究所教授,博士生导师,博士,日本京都外国语大学客员教授,中国台湾东吴大学客座教授,湖北省政府特聘“楚天学者”讲座教授,中国修辞学会会长,主要从事修辞学、语言学理论及中国古典文学研究。(上海)引 言聊天机器人 一经推出,便掀起了新一轮人工智能的讨论热潮。不同行业的精英、不同领域的学者,甚至不懂技术的普通民众,都参与了这场大讨论。因 关涉自然语言处理的语言技术、语言理论和语言应用(如语法、修辞)等问题,故笔者对 也给予了关注。现从语言学角度来谈一谈 与中国语言学未来的粗浅看法。之所以要谈 与中国语言学的未
3、来,而不是谈 与语言学的未来,是因为笔者粗通的外语有限,仅英语与日语两种,且学艺不精,故不敢基于普通语言学视角来作宏观的讨论。然就中国语言学的视角来谈,笔者因有几十年沉潜于汉语言文字学研究的学术经历,自觉有些底气。更重要的是,笔者认为,如何让 基于汉语视角而为国人服务,是中国语言学界同仁的历史使命。是个新鲜事物,且技术在不断快速更新,所以有关 的介绍内容也在不断更新中。截至 年 月 日 点,百度百科“”词条已经更新到 版,浏览量达 人次。年 月 日 点百度百科“”词条的解释为:(全名:),是 研发的聊天机器人程序,于 年 月 日发布。是人工智能技术驱动的自然语言处理工具,它能够通过理解和学习人
4、类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码,写论文等任务。年 月,中国支付清算协会倡议支付行业从业人员谨慎使用。年 月 日,此前临时禁止使用 的意大利开出了解禁的条件,但 日,西班牙国家数据保护局和法国国家信息自由委员会分别宣布对 展开调查。同日,欧洲数据保护委员会宣布成立专门工作组,以促进各国协同调查,并就各数据保护部可能采取的执法措施交流信息。这个词条提供的最有用的信息是:是人工智能技术驱动的自然语言处理工具,它能够通过理解和学习人类的语言与人进行对话,还能根据对话的上下文语境,像人类一样与用户进行互动交流,甚
5、至能完成撰写论文、邮件、视频脚本、文案、翻译、代码等任务。其中,神奇的是它“能够通过理解和学习人类的语言”,尤其神奇的是它能够“写论文”。也就是说,一定程度上可以自主地进行学术活动。据互联网上的消息,在美国的一些大学里,已经有学生利用 完成教师布置的论文作业,不仅完成效率高,而且质量还可以。这不禁引人思考:如果 真能写论文,是否意味着今后我们的学术研究就可以交给 了?我们认为,答案应该是否定的。即使 再怎么更新迭代,的工程师们再怎么训练,它都不可能替代人类。尽管如此,但我们也无法否认,是一项非常重要的技术发明,对科学研究,无论是自然科学(特别是实验科学)还是社会科学、人文科学研究,都有巨大的助
6、推作用。它可以使我们的科学研究基于大数据而效率更高,结论更准确。与语言学密切相关。是人工智能技术驱动的自然语言处理工具,所以它的诞生离不开语言学研究成果的支撑,它的发展又会助推语言学研究不断深化。基于汉语视角的,一定会促进中国语言学的发展,甚至影响中国语言学研究的方向和方法。基于这一认识,本文拟从语音学、词汇学、语法学、方言学、修辞学以及汉语史等几个方面对 之于中国语言学的未来发展前景作一畅想。一、将使语音学研究与教学现状大为改观语音学研究与教学涉及的内容很多,就汉语语音学而言,要研究的内容有:汉语普通话的声母、韵母、声调的构成及其配合,轻音、重音的特点及其作用,元音、辅音的变异与协同,语流音
7、变的规律,普通话语音(北京语音)的音位与音位变体,等等。这些内容,既是以往汉语语音学研究的重要方面,也是汉语语音教学的重要支点。的出现,将促使汉语语音学研究与教学发生重大变化。作为一种人工智能技术驱动的自然语言处理工具,对人类语音感知的灵敏度要远远胜过人的听觉感知,那么基于 工具对汉语语音的分析就会更加精准。如果将 运用于汉语语音研究,凭借 对人类语音灵敏、准确的感应力,以及 在人机对话中不断进化的理解与学习能力,汉语语音研究一定会有出人意料的成果。相对于 世纪初开始的实验语音学(,早期又称仪器语音学)利用各种实验仪器来研究、分析语音,在技术上不知跃升了多少倍。因此,我们相信 在汉语语音学研究
8、方面一定会有新的作为,不会像实验语音学那样长期局限于音长、音高、音强、音色及音位等特征的描写与分析的狭小天地中,而会基于人机对话的语音大数据在汉语语音研究领域有新的发现,进而拓展出汉语语音研究的新天地。在汉语语音教学方面,也大有用武之地。传统的汉语语音教学主要凭口耳,教学效果参差不齐。这既与教学者有关,也与学习者有关。就教学者而言,不是所有的教学者在普通话教学中都能做到发音绝对标准;就学习者而言,不是所有学习者的听力水平都一样,不同人在听觉敏感度上存在差异。因此,很难保证这种语音教学的效果能够达到理想满意度。如果在汉语(包括普通话和汉语方言)语音教学中引入,只要输入的发音是标准的,吴礼权 与中
9、国语言学的未来在执行语音教学任务时输出的发音就是标准的,学习者跟随 模仿学习,学到的发音也一定是标准的。更重要的是,这样的学习跟传统的语音教学必须借助课堂条件,只能在特定的时间、地点进行完全不同,学习者只要在手机等移动终端上安装 软件,就可以随时随地学习,不仅可以大幅提升学习效率,还会提升学习兴趣和学习质量。因为 “能够通过理解和学习人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流”,学习者就等于拥有一个全天候的高级陪练。人机对话跟人际对话不同。人际对话中,如果学习者在学习过程中不断犯错,进展不大,会影响其学习积极性;若教学者表现出不满意或不耐烦,甚至批评几句,还会
10、挫伤学习者的自尊心与学习兴趣,进而影响学习效率和效果。但是,人机对话则不然,学习者不会因为学习过程中不断犯错而有丢面子的感觉,没有各种心理负担,而且可以随时打开软件温习巩固,学习效率会更高,自尊心和学习积极性不会受到打击。具有理解能力与聊天功能的,既能比人更敏锐地发现学习者发音上的错误,又会比人更有耐心地纠正学习者的发音错误,甚至可以模仿学习者发音的错误,跟自己正确的发音进行对比,让学习者在比较中发现问题,进而有针对性地改正自己的发音,提高发音的准确性。这种做法还可应用于普通话的普及推广,尤其是少数民族地区或港澳地区民众的普通话培训。在对外汉语语音教学方面,能够发挥的作用更值得期待。来华求学的
11、外国留学生,或是在海外接受国际中文教育的外国学生,在学习汉语普通话发音时遇到的问题较多,有的是声母问题,有的是韵母问题,更多的是声调问题。因为作为目的语的汉语与他们的母语在语音系统上有很大差异,有的音是他们母语中所没有的,所以要他们动用他们根本不曾动用过的发音器官发出汉语中的某些音,说出地道的汉语,是非常困难的。就像中国人学习俄语或意大利语,怎么练习都发不好小舌颤音一样,他们的发音总让中国人听来有一种怪怪的味道,即所谓的洋腔洋调。为了解决这些问题,我们在对外汉语教学中要花费大量时间纠正外国学生的发音错误,包括声、韵、调三个方面。然而,即使我们最终帮助他们纠正了这三个方面的错误,他们读单个汉字时
12、都能做到发音标准,但是读一句话或说一句话时,因为不懂“语流音变”规律,就又“洋腔洋调”了。外国学生学习汉语,有别于他们的母语习得。汉语作为他们的第二语言或第三语言,既无从小跟随大人在日常生活中自然习得的方便,也无终生学习的可能。他们对汉语的学习需要在一定的时间内完成,并且要达到一定的熟练程度。因此,教授、训练、纠正他们发音的教学时间不可能太多。为了弥补汉语发音训练时间的不足,外国学生必须在课后想办法强化训练,不然,就难以解决汉语发音方面的问题。如果借助 这一“人工智能技术驱动的自然语言处理工具”,利用 具有“根据聊天的上下文进行互动”的能力,创造一种类似人际交流的会话场景,那么外国学生学习汉语
13、发音方面的问题就会在寓教于乐的轻松氛围中解决了。作为一种先进的科学技术发明,对年轻学生肯定具有足够的吸引力,能够激发出他们强烈的好奇心与学习热情。二、将使词汇学研究与教学更有效率相比于语音学,词汇学研究与教学所涉内容更为丰富,可以助力的方面也更多。比如,词义的历时发展变化,包括词义扩大、词义缩小、词义转移,一直是词汇学领域研究的重要问题。以前考察某个词的词义发展演变,主要是通过大量历史文献的阅读分析,从中找出足够的例证,用材料说话,以证明某个词的词义是如何发展演变的。然而,汉语是世界上历史最北华大学学报(社会科学版)年第 期为悠久的语言之一,“汉语有文献的历史长达三千多年,自古以来方言就很复杂
14、,历代累积下来的词汇以数十万计。”面对如此丰富发达的词汇,要探索汉语词义古今发展演变的历史轨迹及其规律,就需要阅读浩如烟海的历史文献,并从中披沙沥金,找到词义发展演变的语言事实(语料),才能得出信而有征的结论。尽管这方面的研究成果已在 辞源汉语大词典 等大型辞书的许多词条中有所体现,但 辞源 汉语大词典 或其他语文辞书所提供的词语的词义发展演变的结论是否都可靠,学术界的意见并不一致。比如,某个词在什么时代发展出一个新义,辞书中虽然会举出相关的例证,看起来是基于历史文献中的语言事实,是信而有征的,但这个结论也许并不可靠。因为可能还有更早的、更多的语言事实研究者没有找到,或者所举相关例证恰恰是非主
15、流用法的个案。事实上,任何一位汉语词汇学研究者无论怎么努力,无论多么博学,都会有时间、精力的局限,以及所掌握的材料的局限。也就是说,其相关研究并不是基于穷尽性的语言事实。这就是“手工作坊”式的人工研究的局限性所在。正因为如此,这些辞书会不断根据学者们发现的新材料、新例证和得出的新结论,对相关词条的释文予以修正。因此,只要有学者找到了新的不同的语言事实为证据,原来的结论就必须推翻而代之以新的说法。但是,如果我们借助 这一“人工智能技术驱动的自然语言处理工具”,像 的工程师们那样对 进行相关能力的训练,并将相关汉语历史文献全部数据化,那么,就可以依托大规模的语料库,让具有理解与学习能力的 基于大数
16、据模型自主开展搜集、整理、分析工作,对汉语词义的发展演变做一个全面的、穷尽性的研究,进而得出比“人工作坊”式的研究更可靠的结论。如果将 基于大数据模型得出的结论写入 辞源 汉语大词典 等汉语辞书的词条,就会大大提升语文辞书的权威性。又比如,基本词汇与一般词汇都是汉语词汇学研究的对象,学者们既关注基本词汇的稳固性与可延续性,也关注一般词汇的非稳固性与可转变性。汉语词汇史研究需要通过考察不同历史时期汉语基本词的数量变化来分析汉语基本词的发展演变规律,从而了解哪些基本词是稳固的,从上古到中古,从近代到现代,始终活跃于汉语表达中;哪些基本词又是如何逐渐失去了“常用性”,进而失去了“全民性”,最终变成一
17、般词的。同时,汉语词汇史研究也要通过对不同历史时期词汇发展演变情况的全面考察,探究一般词是如何随着社会的发展变化而逐渐具有“常用性”与“全民性”,进而由一般词晋级为基本词的。这两个方面的研究,是过往汉语词汇学研究者用力最多的,但也是研究结论最不一致而争议最多的。究其原因,是研究者们所依据的历史语料不同,或是在历史语料的占有数量上存在差异所致。语言学研究,其结论是建立在语言事实基础之上的,语言事实的调查获取越是扎实丰富,结论就越令人信服。传统的汉语词汇学研究,都是依靠研究者大量搜集、阅读汉语历史文献,从中爬梳语料,最终得出结论的。但人的时间、精力与视野是有限的,故这样的研究既辛苦又效率不高,还很
18、难保证结论的可靠性。的出现,情况可能就完全不一样了。只要做好基础工作,即将相关的汉语历史文献进行数据化处理,具有自主理解与学习能力的 就能基于大数据模型,按照我们设定的研究目标而对大规模语料进行“提取分析”的自主研究。这样的研究,得出的结论肯定比“人工作坊”式的研究要可靠,而且效率要高得多。参与的汉语词汇学教学,也会更有吸引力,效果会更好。外来词是汉语词汇的有益补充,也是观察中国社会历史发展的重要窗口,还是研究中国与世界其他民族政治、经济、文化等交往历史的活化石,因此外来词的研究一向都是备受学者们重视的。但是,由于汉语吸收外来词历史悠久,且引入途径复杂,有的是“直接进入民族共同吴礼权 与中国语
19、言学的未来语”,有的是“先进入方言区,然后吸收进民族共同语”,要系统研究汉语外来词,梳理各种外来词的来龙去脉,不仅工作量大,而且还不能保证研究结论的准确可靠。因为外来词是伴随着不同历史时期的中国跟世界其他民族主动或被动交往而逐渐进入汉语的,它们或见之于中国古代的各种正史或野史,或见之于诗、词、曲、赋等文学作品,或是见之于文人笔记、散文、小说(如敦煌变文,宋元话本小说)等。由于外来词进入汉语非一朝一代之事,也非来自一两个外民族的语言,加上外来词的语言事实多是零碎而分散的,不像汉语词汇系统中其他成分那样较为集中地呈现于特定的某类历史文献中,搜集、查阅、整理、分析语料的工作特别繁重,因而研究汉语外来
20、词的历史演变就相当困难。现在有了 的加持,只要我们做好前期历史文献的数据化工作,那么汉语外来词的研究工作就可以设定不同的课题,让 基于大数据模型展开“自主”研究。如要对现代汉语中诸如“警察”“积极”“消极”“自由”“民主”“化学”“科学”等来自日语的“借形外来词”的身份进行鉴别,清理现代汉语词汇的“家底”,只要将数据化的 现代汉语词典 辞源 辞海 等语文辞书中的全部词目与数据化的日语辞书中的全部词目进行对比分析,就能清理出现代汉语词汇中哪些词是中国的“本土制造”,哪些是源于日本人以汉字为“原材料”进行“加工制造”而成的“东洋制造品”,也就是“来料加工品”。这样的工作,恐怕很难凭一己之力或少数人
21、的合作,采用传统的“人工作坊”式的研究在短期内完成。但借助,这样的工作就能在很短时间内轻松完成,而且结论一定会相对可靠。如果以此研究成果运用于教学中,无论是中国学生学习日语,还是日本学生学习汉语,都会大有助益,最起码可以提升其学习积极性与学习效率。三、将使语法学研究与教学更具科学性语法学可谓是汉语语言学的“显学”,不仅研究者人数最多,而且门派众多。自 马氏文通 以来,汉语语法研究大多都是追尘西方语法理论,真正基于汉语语言事实,看清汉语语法本质及其特点,能够提出自主语法理论的学者很少。正因如此,长期以来汉语语法研究者多陷于对个别语法现象理解的分歧、争论之泥潭而不能自拔。汉语语法跟印欧语系诸语言的
22、语法相比,有着自己鲜明的特点。只是我们的语法研究者长期囿于自己的学术视野与思维惯性,看不清汉语语法鲜明的特点,倒是一些非语言学专业背景的学者,如著名美学家朱光潜和著名文学批评理论家郭绍虞等人,反而是“旁观者清”,对于“横看成岭侧成峰,远近高低各不同”的汉语语法现象有着清醒而独到的认识,能够一针见血地道出汉语语法的特点。如朱光潜在探讨中国诗歌何以走上“律”之路时曾经说过:“西文的文法严密,不如中文字句构造可自由伸缩颠倒,使两句对得很工整。比如 红豆啄余鹦鹉粒,碧梧栖老凤凰枝 两句诗,若依原文构造直译为英文或法文,即漫无意义,而中文里却不失其为精练,就由于中文文法构造比较疏简有弹性。再如 疏影横斜
23、水清浅,暗香浮动月黄昏 两句诗没有一个虚字,每个字都实指一种景象,若译为西文,就要加上许多虚字,如冠词前置词之类。中文不但冠词和前置词可以不用,即主词动词亦可略去。单就文法论,中文比西文较易于诗,因为它比较容易做得工整简练。”朱光潜所言的“西文的文法严密”、“中文字句构造可自由伸缩颠倒”、“中文文法构造比较疏简有弹性”,就是汉语语法之鲜明特点。郭绍虞跟朱光潜不同,他对汉语语法特点的认识不是在谈文学时顺便提出来的,而是专门撰写了一部近六十万字的 汉语语法修辞新探,以文学批评家对母语汉语的直觉,指出了汉语语法的三个特点:简易性、灵活性、复杂性。其中,前两个特点就是朱光潜所说的“疏简有弹性”。可见,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- ChatGTP 中国 语言学 未来 吴礼权
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。