迈向可信AI:ChatGPT类生成式人工智能的治理挑战及应对.pdf
《迈向可信AI:ChatGPT类生成式人工智能的治理挑战及应对.pdf》由会员分享,可在线阅读,更多相关《迈向可信AI:ChatGPT类生成式人工智能的治理挑战及应对.pdf(15页珍藏版)》请在咨信网上搜索。
1、28迈向可信 AI:Ch a t G PT 类生成式人工智能的治理挑战及应对曹建峰摘要:2 0 2 2 年以来,随着以ChatGPT、G PT-4等大型语言模型为标志的生成式人工智能的迅猛发展,人工智能迎来大模型时代。AI大模型被认为是革命性的技术进展,将给经济社会发展带来深远影响。然而,AI大模型的快速发展应用也持续引发各界对其伦理安全风险的担忧。面对生成式人工智能的伦理安全风险和治理挑战,有必要在治理上倡导并推动践行“负责任人工智能”的理念,建立敏捷灵活的AI监管和治理框架,通过多元化的治理举措支持生成式人工智能创新发展和可靠应用,推动建立负责任的、可信的、以人为本的、合乎伦理道德的生成式
2、人工智能发展生态。关键词:生成式人工智能;人类反馈的强化学习;人工智能治理路径;科技伦理治理;人工智能治理社会化服务;安全防护措施中图分类号:DF0-052文献标识码:A文章编号:16 7 4-9 50 2(2 0 2 3)0 4-0 0 2 8-15作者:曹建峰,对外经济贸易大学数字经济与法律创新研究中心研究员。2022年被认为是生成式人工智能(GenerativeAI)的拐点,人工智能不仅仅像以前那样做分类或预测,而且开始独立自主地创造连贯性内容,诸如文本、图像、视频、代码等。尽管任何算法都可以产出特定的输出,但生成式AI模型却可以基于其训练数据,对用户的输人(称为“提示词”,英文为Pro
3、mpts)作出回应,产出图片、文本、音频、视频等连贯的、具有意义的、令人信服的内容。生成式AI模型,包括ChatCPT、CPT-4等大语言模型(LargeLanguageModels,LLM)和Midjourney、St a b l e D i f f u s i o n 等图像生成模型,又被称为基础模型(FoundationModels),其作为基于种类丰富的海量数据预训练的深度学习算法,展现出强大的、更加泛化的语言理解和内容生成能力,一下子将科幻拉人现实,因此获得了广泛的关注。生成式AI因此被认为是人工智能领域的一次跃迁(从感知、理解世界到生成、创造世界的跃迁),将成为新的生产力工具和创造
4、力引擎,深刻影响经济和社会。本文系2 0 2 0 年度国家社会科学基金青年项目“人工智能与民法典双重背景下个人信息保护研究”的阶段性研究成果,项目编号20CFX041。See Alex Engler,“Early Thoughts on Regulating Generative AI like ChatGPT,Feb.21,2023,https:/www.brookings.edu/blog/techtank/2023/02/21/early-thoughts-on-regulating-generative-ai-like-chatgpt/amp/,accessed by April 4,
5、2023.参见曹建峰、陈楚仪:A IG C浪潮下,合成数据关乎人工智能的未来,新经济导刊2 0 2 2 年第4期。29.迈向可信AI:C h a t G PT 类生成式能的治理挑战及应对尤其是生成式AI在文本生成和图像生成上的巨大成功,不仅激起了新的AI发展浪潮,而且重燃了人们对可能实现比肩人类智能水平的通用人工智能(Artificial General Intelligence,A G I)的憧憬。在文本生成方面,美国AI研究机构OpenAI于2 0 2 2 年11月30 日推出的对话机器人应用ChatGPT可谓是最典型的代表。ChatGPT是基于大语言模型GPT-3.5和GPT-4,经过微
6、调(FineTuning)开发的对话机器人应用。ChatGPT让人惊艳的地方在于它的通用性和多才多艺;ChatCPT所捕获的知识远超任何个人所知道的知识,这使得其可以胜任各种形式的文字任务,诸如写文章、创作诗歌、写代码、做翻译,等等。ChatGPT发布后两个多月时间就获得了1亿用户,是有史以来用户增长最快的消费者应用程序。驱动ChatGPT的大模型CPT-4则在美国通过了法律、医学等领域的职业资格考试且名列前茅。微软公司的研究团队甚至得出结论称GPT-4正在接近人类水平的智能(AGI),认为GPT-4闪现出了通用人工智能的火花,可以被看作是通用人工智能系统的一个早期版本。深度学习之父Geoff
7、reyHinton在接受采访时表示,在GPT-4出现之前,他认为实现AGI可能需要2 0 50 年,但现在可能在2 0 年内就能实现。在图像生成方面,人们惊艳于Midjourmey、D a l l e-2、St a b l e D i f f u s i o n等生成模型的强大理解和创造能力,可以把用户输入的任何文字描述转化为惟妙惟肖的图像。可以说,在文字、代码、图像等多种内容的生成方面,生成式AI已经足以比肩人类。ChatGPT的成功,在科技行业引发了新一轮AI发展竞赛,国内外的主流科技公司纷纷加人生成式AI大模型的竞赛中来,竞相训练各自的大型语言模型。在此背景下,生成式AI的应用此起彼伏,
8、其发展变化如此之快,以至于似乎给人们的适应能力提出了真正的挑战。一场真正的AI革命似乎正在加速到来。比尔盖茨坦言,在他的一生中,见过两个可谓革命性的技术展示,一次是19 8 0 年见到的用户图形界面(现代操作系统的先导),另一次就是2 0 2 2 年看到的OpenAI公司开发的GPT模型。但与此同时,全球各界对生成式AI的近忧远虑日益增多,甚至认为人工智能可能给人类和人类社会带来巨大风险。例如,意大利的数据保护机构出于隐私和个人信息安全担忧而暂时封禁了ChatGPT,并在OpenAI公司采取了回应措施之后才予以解禁。在美国,非营利性研究机构人工智能与数字政策中心(Center forAI an
9、d DigitalPolicy)向美国联邦贸易委员会(FTC)作出投诉,要求对OpenAI公司进行调查,并在必要的防护措施建立之前防止发布新的AI模型。面对生成式AI的风险和挑战,中国、美国、欧盟等已启动制定新的监管规则。此外,大模型在隐隐透露出通用人工智能(亦称“强人工智能”)的曙光的同时,也引发了人参见陈永伟:超越ChatGPT:生成式AI的机遇、风险与挑战,山东大学学报(哲学社会科学版)2 0 2 3年第3期。See“Large,Creative AI Models Will Transform Lives and Labour Markets,Apr.22,2023,https:/ b
10、y May 4,2023.See Wikipedia,“ChatGPT,at https:/en.wikipedia.org/wiki/ChatGPT,accessed by April 4,2023.See Sebastien Bubeck et al.,“Sparks of Artificial General Intelligence:Early Experiments with GPT-4,last revised on Apr.13,2023,https:/arxiv.0rg/abs/2303.12712,accessedbyApril14,2023.See CBS News,God
11、father of Artificial Intlligence Weighs in on the Past and Potential of AI,Mar.25,2023,https:/ by April 4,2023.参见陈楚仪、曹建峰:AIGC技术的发展趋势、影响和展望,中国银行业2 0 2 3年第4期。See Bill Gates,“The Age of AI has Begun,Mar.21,2023,https:/ by April 15,2023.See Supantha Mukherjee&Giselda Vagnoni,“Italy Restores ChatGPT afte
12、r OpenAI Responds to Regulator,Apr.28,2023,https:/ by May 15,2023.302023年第4期上海政法学院学报(法治论丛)们对AGI安全和控制问题的担忧。例如,2 0 2 3年3月2 2 日美国非营利性研究机构未来生命研究所(Fu t u r e o f Li f e In s t i t u t e)发布公开信,呼吁全世界所有的AI研究机构暂停训练比GPT-4更加强大的AI系统,为期6 个月。公开信认为,CPT-4等现代AI系统开始在一般性任务上有能力与人类同台竞争。如果任由AI系统不加约束地发展,就有可能给信息信任(虚假信息充斥信息
13、渠道)、人类工作(机器取代人类工作)、人类主体性(机器在智力和数量上超过人类)甚至人类文明(人类失去对文明的控制)带来灾难性风险。因此,只有当人们自信AI系统的影响是积极的,其风险是可控的时候,才可以开发更加强大的AI系统。总之,面对生成式人工智能的迅猛发展,人们需要加强人工智能治理,积极应对生成式人工智能的短期和中长期挑战以及未来人工智能的潜在安全和社会伦理影响,以更加负责任的方式发展可信的、以人为本的人工智能。一、生成式人工智能发展现状和趋势现代人工智能的能力大爆发肇始于2 0 10 年前后,海量数据和强大算力的结合,让“深度学习”(D e e p Le a r n i n g)技术如虎添
14、翼,显著地提升了计算机在识别图像、处理音频、玩游戏等方面的能力,但这高度依赖于仔细标注的训练数据。如今,计算机在很多任务上可以完胜人类。但语言一直被认为是人类智能的专属领域,人工智能在这方面的进展始终十分有限。然而,2 0 2 2 年以来,以ChatGPT、G PT-4等为代表的LLM的突破性发展,第一次向人们展示了AI生成内容(AI-GeneratedContents,A ICC)可以比肩人类水平。以色列历史学家尤瓦尔赫拉利甚至认为,通过操纵和生成语言,生成式AI已经侵人了人类文明的操作系统。2大语言模型作为生成式AI的最典型代表,其最近取得的巨大成功(包括生产令人信服的文本内容,以及具有令
15、人吃惊的“涌现能力”),主要得益于三个要素的组合:巨量数据,可以从数据中学习的算法(现在的大语言模型主要依靠Transformer算法),以及支持学习算法的强大算力。以ChatCPT为例,其技术原理主要分为两个阶段:首先是底层的大语言模型(如GPT-3和GPT-4)的预训练阶段,即拿巨量的数据来训练模型,让模型进行“自监督”学习,不断优化模型参数(目前大语言模型的参数规模已经达到了千亿、万亿级别)。不同于之前的AI模型,大语言模型不要求事先对数据进行标注,因此可以在更大规模的数据集上进行训练;实际上,大语言模型可以基于整个互联网的文本数据进行训练。GPT-3的训练数据是文本,主要来自互联网上的
16、公开信息,但也包括其他来源的数据。GPT-4则在文本数据之外,加人了大量的图像数据进行训练,因此可以同时处理文本和图像的输入,朝着多模态AI迈进了一大步。大语言模型的核心能力来源于预训练阶段。而且不同于传统的自然语言处理技术(NLP),借助transformer算法及其“注意力网络”(AttentionSee Future of Life Institute,“Pause Giant AI Experiments An Open Letter,Mar.22,2023,https:/futureofife.org/open-letter/pause-giant-ai-experiments/,a
17、ccessed by April 15,2023.See Yuval Noah Harari,“Yuval Noah Harari Argues that AI Has Hacked the Operating System of Human Civilization,Apr.28,2023,https:/ byMay24,2023.31迈向可信AI:Ch a t G PT 类生成式人工智能的治理挑战及应对Network),现在的大语言模型把各类语言任务和推理任务统一为“生成式”任务,显著提升了AI模型的通用性和泛化能力。其次是利用额外的标注数据对模型进行微调,这一过程使用的核心算法称为人类反
18、馈的强化学习(ReinforcementLearning fromHumanFeedback,R LH F),简单来说就是通过人类专家提供的样例和反馈,来引导模型输出更加符合人的需求和价值的内容。对于ChatGPT的巨大成功来说,RLHF算法绝对功不可没。RLHF算法让模型更加符合人类的价值观和目的意图,从而能够输出有用的、可信的、无害的内容。就其运行而言,大语言模型实际上做的是“预测下一个字”(PredicttheNextword)的任务(被戏称为“文字接龙”游戏):模型先基于“提示词”产生第一个字,然后把第一个字带人模型产生第二个字,然后把前两个字带人模型产生第三个字,以此方式持续运算直至
19、产生所有的输出。这一过程被称为“自回归”(Autoregression)。因此,大语言模型实际上是以统计的方式而非语法的方式理解语言,在这个意义上,它更像是一个巨大的“文字算盘”,而非像“人类的心灵”。所以现在的大语言模型被认为是大型的统计预测机器。在技术原理上,大语言模型的能力和行为来源于模型的“预训练”和“微调”这两个阶段,其在回答用户的提问时,并不是从一个数据库中或网络上检索、访问既有数据,而是在很大程度上基于语言文字之间相互联系的概率预测出回答。大语言模型的最重要特征是它的涌现能力(EmergentAbilities),即当模型规模(就模型参数、权重而言)大到一定程度后出现了超出训练目
20、的(即预测下一个字)的能力或者小模型不具有的能力,诸如翻译、常识推理、算术、编写计算机程序、解决逻辑问题等。按照这一逻辑,只要人们把模型变得更大,模型就能够做各种各样的事情,成为更加实用、更加灵活、更加通用的工具。总之,涌现能力是这些极其巨大的“文字算盘”和其他更小的模型的一个关键区别,就是说大语言模型可以做小模型做不了的事情。OpenAI公司的研究人员统计出了不同大语言模型的137 项“涌现”能力。涌现能力意味着大语言模型具有源源不断的、未被开发的潜力。虽然如此,大模型的路径依然存在一些局限性,例如训练成本高昂(GPT-4的训练成本估计超过1亿美元),训练成本的增长快于模型性能的提升,最终可
21、能让模型训练的成本和效益严重倒挂;此外,可用的训练数据面临制约,CPT-3和GPT-4可能已经把互联网公开信息中几乎所有的高质量文本都拿去训练了,2 0 2 2 年10 月发布的一篇研究文章称,很有可能到2 0 2 6 年前,高质量的语言数据就会被用尽。OpenAI公司首席执行官SamAltman在一个场合甚至称,AI大模型的时代已经结束了,未来人们需要以其他方式让大See Sujatha Sagiraju,“How Reinforcement Learning with Human Feedback is Unlocking the Power of Generative Al,Apr.23
22、,2023,https:/ by April 24,2023.See Mark Riedl,“A Very Gentle Introduction to Large Language Models without the Hype,Apr.14,2023,https:/mark- by April 24,2023.?See OpenAI,How should AI Systems Behave,and Who should Decide?,Feb.16,2023,https:/ byMay27,2023.See Pablo Villalobos et al.,“Will We Run out
23、of Data?An Analysis of the Limits of Scaling Datasets in Machine Learning,Oct.26,2022,https:/arxiv.0rg/abs/2211.04325,accessed by May 27,2023.32上海政法学院学报(法治论丛)2023年第4期语言模型变得更好、更实用。大语言模型等生成式AI技术带来了新的AI发展范式,其应用前景十分广阔。对于大众而言,生成式AI意味着新的创造力工具,将在更大程度上解放个体的创造力和创意生产。生成式AI介人创意工作和消费性内容的生产可能带来三种可能性:AI辅助创意的大爆发;A
24、I垄断创意;人类创造更加优质且高价格的内容。如果未来生成式AI真的垄断了创意工作,AI生成内容取代了人类创造的内容,那么以人类和人类的创造为中心的版权制度将面临灭顶之灾,断言“版权法已死或者将死”也许并非妄言。对于经济社会发展而言,生成式AI意味着新的生产力工具,将带来生产效率的极大提升。比尔盖茨将人工智能的发展和微处理器、个人电脑、互联网以及智能手机相提并论,认为其将重塑所有的行业。微软公司首席执行官Satya Nadella认为,ChatGPT是知识工作者的“工业革命”,断言人工智能将彻底改变所有类型的软件服务。目前,搜索、办公、在线会议等诸多软件服务都已融入了生成式AI的能力。AI大模型
25、的更大的经济影响在于,其有望像智能手机的操作系统那样,形成一个产业生态。OpenAI公司首席执行官SamAltman称,多模态的AI大模型有望成为继移动互联网之后的新的技术平台。这意味着,开发人员基于预训练的AI大模型,可以通过模型微调快速开发出垂直领域的模型应用并予以部署使用,人工智能的革命性正在于此。此外,生成式AI的典型代表ChatGPT通过人类语言与用户交互,带来了更简单、更自然的用户交互界面(UserInterface),正在改变人机交互的方式。在这个意义上,ChatGPT类生成式AI应用有望成为比尔盖茨口中所谓的每个人的“数字化个人助手”总结而言,以ChatCPT为代表的生成式AI
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 迈向 可信 AI ChatGPT 生成 人工智能 治理 挑战 应对
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。