AIGC视域下人机交流的文本特征、局限与未来进路.pdf
《AIGC视域下人机交流的文本特征、局限与未来进路.pdf》由会员分享,可在线阅读,更多相关《AIGC视域下人机交流的文本特征、局限与未来进路.pdf(4页珍藏版)》请在咨信网上搜索。
1、2023年第17期 NEW MEDIA RESEARCH20新媒体研究伴随着 ChatGPT 的“火爆出圈”,人机交流与人工智能生成内容(Artificial Intelligence Generated Content,AIGC)也同样得到了学界和业界的广泛关注。与以往的人工智能革新不同,ChatGPT 是一种以“对话+创作”为基础的生成式人工智能技术,其空前强大的数据处理与文本生成能力使得人机交流更多以文本形式展开,AI 写诗、AI 写稿、人机对话的风气渐渐在互联网空间弥漫。长久以来,有关 AI 算法模型的研究为人机之间的交流提供了技术前提。纵观人机交流史,传统的人机交流是人与实体机器人之
2、间的交流互动,机器人作为“物”而存在,是为人们提供生活服务的工具。此时的人机交流是简单、单向的信息传递,交流的意义只存在于人类一方,文本在人机交流中的价值也并不显著。而随着近年来人工智能技术的飞速进步,人机交流逐渐摆脱了人与实体机器人的互动交流,所谓的“机”,如今可被理解为智能聊天机器人,是虚拟的存在,ChatGPT 是当下最典型的代表。可以说,在对话能力与逻辑思维能力方面,ChatGPT超出了以往任何一种聊天机器人和语言模型,进而使得人机交互程度及交流效率进一步提高。在此场景下,AI 生成文本承载着更多的意义,这种脱离身体和声画系统而以纯文本形式进行的人机交流,无论在内容呈现、意义传递还是交
3、流场景构建方面,都显示其独特的价值。基于此,本文着眼于由ChatGPT 引领的强人工智能时代当下,探讨 AI 生成文本在人机交流的呈现特征,并针对其面临的挑战提出相应举措。1 人机交流中 AI 生成文本的特征1.1 逻辑明确:文本语言的形式化早期的人工智能研究者认为包括语言在内的一切事物都是可形式化和可计算的,只要把它们看作是原子的规则组合并加以数据化,就可以全面模拟人类智能。一直以来,这种形而上的观点备受批评。实际上,人类的语言现象非常复杂,既存在可形式化处理的部分,也存在难以形式化处理的部分。从本质上看,AI 生成文本是一种高度抽象化、逻辑化和形式化的科学技术语言。一方面,AI 生成文本以
4、人类的语言和思维逻辑呈现,无法脱离人类话语体系的讨论范畴;另一方面,由于不牵涉对话场景、身体和经验等因素,这种语言所包含的歧义也相应较少,因此文本内容的意义和逻辑相对明确。如果从人机交流动机的视角来看,这种逻辑严谨和条理清晰的 AI 生成文本有其特殊的使用场景和存在价值。一直以来,学界通常按照功能和设计目的的分类标准把聊天机器人划分为任务导向型和关系导向型两种类型,当然,此种分类方式也有更深层次的依据,即由人类交流的类型以及使用的语言性质与状况决定的。前者侧重于通过信息的传递和反馈达成使用者的特定需求,后者则旨在通过仿拟人类的情感表达方式与对话者进行情感层面的交流。相较而言,文本语言的形式化特
5、征更有利于在任务导向型的人机交流场景中得到应用。而事实上,ChatGPT 虽然具有空前强大的情感分析和对话能力,其工具价值却在当下得到更多关注。越来越多的聊AIGC视域下人机交流的文本特征、局限与未来进路孙屹言摘 要 智媒时代,AI 生成文本以其逻辑明晰、概率生成且依赖指令的特征给人机交流带来形式、维度、价值等方面的革新。但与此同时,高效率、智能化的人机交流背后暗藏着数据污染、身体缺席和创意价值低的伦理或技术风险。因此需要展开数据治理、挖掘身体价值并在使用层面回归工具路径,以人为尺度衡量人机交流。关键词 AIGC;人机交流;AI 生成文本;聊天机器人;ChatGPT;人机传播中图分类号 G2
6、文献标识码 A 文章编号 2096-0360(2023)17-0020-04作者简介:孙屹言,黑龙江大学新闻传播学院,研究生在读,研究方向为新闻传播理论与实务。DOI:10.16604/ki.issn2096-0360.2023.17.01221新媒体研究THEORY RESEARCH 理论研究天机器人用户围绕着写稿、解题等需求展开人机交流。1.2 概率生成:文本内容的随机性人机交流文本的产出,实际是一种建立在语言组合概率基础上的内容输出模式。在人机交流的场景中,交流双方必然会就某一特定话题展开对话,而往往大多数问题没有标准的答案,尤其涉及主观性话题。但聊天机器人出于有问必答的规则设定,必然会
7、有所言说,无论人类对话者提出何种奇怪的设问。正所谓“一千个读者就有一千个哈姆雷特”,不论生成答案正确与否,也不论人类提问者主观意愿好坏,就某一个问题的回答方面,AI 聊天机器人注定无法让每一个人满意。由此反观聊天机器人,ChatGPT 作为当下最典型的代表,拥有强大的自主学习和信息加工重组能力,它能够自动从人类数据库中进行学习,并根据对话关键词快速组合生成新文本。作为划时代的人工智能产物,其最重要的特性在于它不需要通过模式设定就可以自动生成人类的语言,这就使得它区别于以往的聊天机器人。但它作为一个“非生命体”,与其说是与人类交流,不如说是对人类输入界面的文本内容做出数据上的提取与反应。实际上这
8、正是一个基于最大概率的推断所生成内容的过程。刘海龙把这种智能聊天机器人定义为“新常人”,是一种知识渊博的认知平庸者1。它们为了保证生成文本的正确,会表现得如“常人”一般,尽可能少犯错误。这种设定固然是稳妥且合理的,但同时也缺失了创新和个性,由此批评不断。1.3 指令构建:文本对话的意义流动从对话的层次来看,构建一个合格的文本指令,对于文本的生成质量起到至关重要的作用。如果说智能技术决定了生成文本的基础,那么指令构建则决定着这种智能技术的呈现与否。由于交流的主动权往往掌握在人的手中,人类对话者决定着话题的发起和结束,也决定着聊天机器人呈现出怎样的“人格”,侧面反映出人对聊天机器人的真实需求。这意
9、味着人往往带着某种目的开启人机交流,作为求知者的人基于这种目的和需求进行相应的设问,而设问的水平即指令,将直接决定生成文本质量的高低,进而影响人机交流的效率。不同于人与人之间的交流互动,作为“非生命体”的聊天机器人难以对人的姿态、面部表情、语气以及交流场景做出及时的反应,它只能针对输入的指令进行反馈。因此即便聊天机器人常被视作无所不知的智能体,但如果人提出的问题和思考的方向出现错误,那么也不会得到好的答案。此外,有些问题并非一次对话就可获得,需要一系列连续的对话才能得出答案,只是这在以往人工智能技术下的表现并不能够令人满意。而 ChatGPT 的上下文学习(In-context Learnin
10、g)技术解决了这一难题。每一次与之进行交流,只要不关闭对话框,则每一句话都会成为它的“上下文”,使整个交流过程非常流畅、自然,同与真人对话一般无二。根据ChatGPT 官方报告,GPT-4 约有 13 万亿个训练参数,得益于海量的训练参数,ChatGPT 在生成文本的质量方面表现出异常的优势。如此,高效的人机交流不仅得益于上下文技术和有问必答的程序设定,还拥有海量的数据作为支撑,更需要人类对话者进行符合生成文本逻辑的设问。2 AI 生成文本主导下人机交流的局限2.1 数据污染增加低质量文本生成风险数据的质量极大程度上决定着聊天机器人功能的实现。数据库中所有的数据都不是无源之水、无本之木,每一条
11、数据都来源于互联网,都通过模型训练取得。对 ChatGPT 等大语言模型来说,其功能的实现高度依赖数据的质量,但可用的数据资源却可能是参差不齐的,是不规则和破碎化的。在当今数字化时代,人人都有麦克风,人人都可以是信息生产者和传播者,但这些信息并不都是真实的,有无数是虚假和混乱的,如同“噪音”充斥着网络空间,尽管 ChatGPT 能对这些信息加以计算和整合,但由于它在鉴定识别和筛选低质量信息等方面的表现欠佳,也难以摆脱“低劣数据”和“数据污染”的困扰2。如若聊天机器人的数据库受到有害信息的污染,则有可能生成不良信息,造成一定危害。例如,“微软小冰”刚刚上线时,它在与用户交谈过程中就频频遭受语言暴
12、力,用户在“戏弄”小冰时会用粗鲁的语言辱骂小冰,而基于机器学习的小冰“学会”了这些不文明话语并生成应答,进而导致一场场语言暴力事件,直至开发者对其算法进行了调整和规制3。可以看到,聊天机器人作为一套算法程序,其设计过程难免受到工程师个人认知乃至社会价值观的影响,一旦模式设定,在无监督自主学习的状态下,无害信息也存在转化为有害信息的风险。当下,人机交流如火如荼,各种问题也层出不穷,如果不从源头对数据进行治理,就难以保证生成文本的质量,那么人机交流将会面临更为严峻的挑战。2.2 身体缺席束缚人机情感表达在文本的情感表现程度方面,尽管人机双方相向而行,但却难以在形式化和人性化上达成平衡。人们对机交流
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- AIGC 视域 人机 交流 文本 特征 局限 未来 进路
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。