2023年生成式人工智能服务合规发展白皮书.pdf
《2023年生成式人工智能服务合规发展白皮书.pdf》由会员分享,可在线阅读,更多相关《2023年生成式人工智能服务合规发展白皮书.pdf(82页珍藏版)》请在咨信网上搜索。
COMPLIANCE DEVELOPMENTWHITE PAPERAIGCCOMPLIANCE DEVELOPMENTWHITE PAPERC O N T E N T S目 录 注:本文中大部分插图皆由midjourney生成。01 生成式人工智能的概念和关键里程碑 02 生成式人工智能的工作原理和技术机制012009一览了然:生成式人工智能技术观察序 第 壹 篇 章 01401702703204001 生成式人工智能的创新和场景拓展动向02 生成式人工智能应用面临之难021履险蹈危:研判生成式人工智能的演进和风险挑战 第 贰 篇 章 023029审中视外:生成式人工智能法律规制的现行状况和发展动向 第 叁 篇 章 01 海外主要国家在生成式人工智能法律规制方面的现状和趋势02 中国在生成式人工智能法律规制方面的现状和趋势 C O N T E N T S目 录 049条分缕析:生成式人工智能服务管理暂行办法 解读 第 肆 篇 章 01 深化生成式人工智能规制设计02 构建鲜明监管职能框架03 规制落地的挑战056居安思危:创议政府生成式人工智能规制路径 第 伍 篇 章 05706206301 关于大模型提供与使用企业的思考02 不同领域内应对方案03 全面配合监管机构要求065以权达变:企业对生成式人工智能规制的应对和思考 第 陆 篇 章 068074078081结 语 P R E F A C E前 言生成式人工智能AIGC(Artificial Intelligence Generated Content)是人工智能1.0时代进入2.0时代的重要标志。AIGC既是从内容生产者视角进行分类的一类内容,又是一种内容生产方式,还是用于内容自动化生成的一类技术集合。2022年11月30日,美国人工智能公司OpenAI正式推出ChatGPT,一款基于大语言文本的智能对话模型。根据Lucintel发布的最新报告,未来全球人工智能市场在医疗保健、安全、零售、汽车、制造和金融技术领域增长迅速,预计到2025年将达到700亿美元,20202025年的复合年增长率为21%。生成式人工智能的发展已然成为必然趋势,但与此同时也伴随了许多新的问题。近日,人工智能安全中心(CAIS)发布了一份由OpenAI及DeepMind高管、图灵奖获得者及其他人工智能研究人员签署的简短声明,声明内容只有一句:“应该像对待包括流行病和核战争等其他全球性迫切社会问题一样,缓解AI引发的灭绝性风险。”警告称他们的毕生成果可能会毁灭全人类。AIGC对于文本、图像、语音、视频和代码等信息内容的生成与传播,涉及人们生产生活各个领域,既提高了人类的生产能力和生活质量,也在全社会引发了与AIGC相关的一系列争议、困惑和忧虑。为了促进AIGC的创新健康发展,我们全面梳理AIGC的发展历程、技术原理、应用场景和各国法律规定,试图为政府未来的监管和企业应对提供一些思路,共同追求AIGC领域始终坚持“人类中心主义”的原则,能够合法、合规地持续高质量发展。PAGE 009PAGE 010PREFACEAIGCCompliance DevelopmentWhite Paper技术观察演进和风险挑战企业应对和思考法律规制的现状和动向政府规制路径生成式人工智能服务管理暂行办法解读概念和关键里程碑创新和场景拓展动向海外主要国家关于大模型提供与使用企业的思考不同领域内应对方案全面配合监管机构要求中国职能框架落地挑战要求和调整规制设计应用面临之难数字人技术数据安全个人信息安全风险知识产权风险AI对齐风险、AI伦理风险及信任风险金融行业应用数据安全知识产权伦理广告领域应用军备领域应用工作原理和技术机制行业应用场景生成式人工智能服务合规发展白皮书C H A P T E R01一览了然:生成式人工智能 技术观察 PAGE 012CHAPTER 01AIGCCompliance DevelopmentWhite PaperS E C T I O N 0 0 1生成式人工智能的概念和关键里程碑生成式人工智能AIGC,与PGC(Professional Generated Content,专业生成内容)、UGC(User Generated Content,用户生成内容)相对应,指利用人工智能(Artificial Intelligence,AI)技术可根据用户需求自动生成与之匹配的内容。只需输入要求,生成式人工智能即可帮助创作者自动生成所需内容,创作者可花费更多时间进行主题构思并减少实际创作时间,提升工作效率和创作质量。生成式人工智能表现为一种高效的商业化内容生产方式,目前AI仍为内容制作的辅助型角色,待技术突破后AI可真正作为内容创作者,即生成式人工智能。人工智能的发展时期主要经历了四个阶段,在其发展过程中,AIGC的根本动力和逻辑都与互联网的发展紧密相连,最终落实到算力和数据两大基石的不断扩张。第一阶段为AI诞生以及规则驱动时期(19431980s)。该阶段主要为人工智能概念的诞生和方法论构建,受限于当时的科技水平,仅限于科研实验室内的小范围实验。1950年,艾伦麦席森图灵(Alan Mathison Turing)提出了“图灵测试”,其目的是检验机器是否可以表现出与人类难以区分的智能,这一想法引发了机器产生智能的探讨。1956年的达特茅斯会议首次提出了“人工智能”概念和理论,核心在于如何让机器使用语言、进行抽象思考和形成概念,让它们解决目前只能由人类解决的问题,并自我改善。这次会议后人工智能领域逐渐发展出符号学派、联结学派(神经网络)等分支,围绕如何构造人的智能连接进行了探索,重要成果包括了机器定理证明、跳棋程序和人机对话等。1957年Frank Rosenblatt设计了第一个计算机神经网络“感知机”,它被认为是第一个成功应用神经网络原理解PAGE 013PAGE 014CHAPTER 01AIGCCompliance DevelopmentWhite Paper决实际问题的算法。1958年赫伯特西蒙和艾伦纽厄尔演示了一个名为“逻辑推理家”的软件,被认为是第一个成功设计的人工智能程序。1966年约瑟夫魏鲍姆和肯尼斯科尔比共同开发了第一款可人机对话的机器人“伊莉莎(Eliza)”,其通过关键字扫描和重组完成交互任务。从上面的研究结果可以看出,早期探索阶段主要围绕如何模拟人类思维展开,通过人工设计规则来实现预定目标。第二阶段为知识系统时期(1980s)。该阶段人工智能不仅局限于通过模式化的算法逻辑解决问题,还需要通过自主学习去研究问题。标志是1977年世界人工智能大会上“知识工程”概念的首次提出,由此传统架构逐渐发展成专家系统架构,它是一种基于“规则+知识”的人工智能技术,试图模拟专家在某个特定领域内做出决策的过程。这种系统通常由两个主要部分组成:知识库和推理引擎。知识库包含了专家在特定领域内的经验和知识,通常以规则、事实、关系和概率等形式表示。推理引擎则负责从知识库中提取信息,分析数据,应用推理规则,并生成结论或建议。在这个时期,专家系统在医疗、工业、金融等领域得到广泛应用,主要以大学实验室的专家系统为主。在技术手段方面,算力也在不断提升。80年代,IBM基于隐形马尔科夫链模型(Hidden Markov Model)创造了语音控制打字机“坦戈拉(Tangora)”,它能够处理约20000个单词。人工智能的研究方法也从逻辑推理、搜索算法等领域扩展到了知识表示、推理和学习等多个方面。第三阶段为机器学习时期(1990s-2010)。在Web1.0的推出和Web2.0的持续演化发展过程中,该时期体现了互联网商业化渠道的打通和机器学习的初步探索。此时互联网的网站通常采用静态HTML页面,这些页面是由网站开发者手动编写的,用户只能被动地接受网站提供的信息。在此背景下,机器学习作为探索行业痛点的解决方案之一被提出,它利用算法和统计模型来使计算机在没有明确编程的情况下自动学习,通过对大量数据进行学习,从而归纳出数据中的规律和模PAGE 015式,最终将这些应用于新的数据中以实施预测或分类任务,具体方法包括支持向量机、决策树、朴素贝叶斯等。此时人工智能的商业化能力已基本兑现,但渠道还未铺开。1997年IBM开发的超级电脑“深蓝”战胜了国际象棋世界冠军卡斯帕罗夫,2006年谷歌领导的自动驾驶汽车项目开展,宣告着人工智能商业化规模效应已初步呈现。进入2000年代中后期,社交网站时代用户生成内容(UGC)的产生、社交网络的发展和个性化定制的不断挖掘均为机器学习的深度发展奠定了坚实基础。整体而言,该阶段并没有很多清晰、具体的落地成果,但伴随互联网行业的发展提升,其发展前景越发清晰。第四阶段为深度神经网络时期(2011年至今)。该阶段的核心特点是深度学习方法的迭代更新和商业化的广泛运用。算法上,生成式对抗网络(Generative Adversarial Network,GAN)极大提高了内容生成质量,应用场景拓展到语音处理、图像分类、视频处理、无人驾驶、交互问答等多场景。2011年IBM的Watson在美国电视智力竞赛节目 危险边缘(Jeopardy!)中战胜人类选手获得冠军。同年苹果推出Siri作为iPhone的自然语言问答工具。2015年马斯克联合山姆奥特曼等人共同创建OpenAI,主要目标为制造“通用”机器人和使用自然语言的聊天机器人,GPT初代模型随后研发产生。2016年谷歌旗下DeepMind公司推出的阿尔法围棋(AlphaGo)战胜围棋世界冠军李世石。2017年微软人工智能少女“小冰”推出了世界首部100%由人工智能创作的诗集 阳光失了玻璃窗。2018年谷歌基于基础自然语言模型(NLP)发布了自然语言生成模型BERT。2022和2023年OpenAI先后发布了GPT-3.5和GPT-4,带动生成式人工智能走向新的高潮。如今,互联网数据已经不仅限于简单的文本和图片,而是变为了语义化的数据,可以被计算机深入理解和处理,从而实现更高效的信息管理和应用。PAGE 016CHAPTER 01AIGCCompliance DevelopmentWhite PaperS E C T I O N 0 0 2生成式人工智能的工作原理和技术机制生成式人工智能是一种技术集合,它基于生成对抗网络(GAN)和大型预训练模型等人工智能技术,利用已有数据来寻找规律,并通过适当的泛化能力来生成相关内容。根据监督学习的方法差异,机器学习领域具有判别式(Discrimina-tive)和生成式(Generative)两种典型模型:判别式模型是对条件概率建模,学习不同类别之间的最优边界,从而完成分类任务;生成式模型则面向类建立模型,计算基于类的联合概率,然后根据贝叶斯公式分别计算条件概率,进而根据输入数据预测类别。GAN模型出现后,人们开始利用生成式机器学习模型实现文本、图像、语音等内容的智能合成,学术界将其定义为生成式AI(Generative AI)。算法端方面,人工智能的两个重要阶段为机器学习和深度学习,机器学习主要以神经网络为标志,深度学习则在神经网络基础上构造更深层次的结构对更高维度的数据进行学习。同时这两者可以相互结合,称为深度强化学习(DRL)。时间方面,神经网络的概念出现较早,在人工智能概念提出前的1943年就已经具有雏形。1943年,心理学家麦卡洛克(McCulloch)和数学家皮茨(Pitts)最早将生物学中的神经网络中的最基本的成分“神经元模型”抽象为简单模型,即MP模型。该模型中,神经元从其他神经元或外部环境接收二进制输入并加权相加,将结果与阈值进行比较。如果输入的总和超过阈值,则神经元发射,产生1的二进制输出,否则神经元保持不活动,产生0的输出;由于它只能表示二进制的输出结果,局限性较大。1986年,辛顿(Hinton)以此为基础提出第二代神经网络,利用误差的反向传播算法来训练模型,算法效率大幅提升;算力上通过并行计算和GPU加速等技术,已实现可以处理更大规模的数据和更加复杂的问题。1989年,PAGE 017PAGE 018CHAPTER 01AIGCCompliance DevelopmentWhite PaperYann LeCun等提出LeNet-5模型已实现数字识别。1997年,长短时记忆网络(LSTM)作为循环神经网络(RNN)的改进型被提出,主要用于解决传统循环神经网络中遇到的梯度消失和梯度爆炸问题,使得神经网络可以更好地处理长序列数据。2006年,辛顿首次提出了深度置信网络(Deep Belief Network,DBN),它的训练分为无监督预训练和有监督微调两个阶段,其中对无监督特征的强调成为深度学习的雏形。2014年,新的生成对抗网络(GAN)被提出,它的基本思想是将生成器网络和判别器网络同时进行训练,通过竞争来逐步提高生成器网络的生成能力。训练过程进化为生成器网络的训练和判别器网络的训练两个阶段,通过对真假不断判断和挑战提高相关精度。该阶段在商业化的里程碑事件就是2016年Alpha-Go击败围棋世界冠军李世石,表明了算法在商业化落地后的巨大力量。随后,模型的发展方向主要聚焦长序列的处理和计算效率的提升,代表就是2017年谷歌Transformer模型的发布。它是一种基于自注意力机制的编码解码模型,解决序列到序列(Sequence-to-Sequence)学习任务中的长序列问题,例如机器翻译、语音识别、文本摘要等任务。2017年6月,Google Brain在神经信息处理系统大会(NeurIPS)发表论文 Attention is all you need,首次提出了基于自我注意力机制(self-attention)来提高训练速度的Transformer模型,将其用于自然语言处理。Transformer由编码器和解码器两部分构成,其中编码器用于将输入序列转换为一系列特征向量,解码器则将这些特征向量转换为输出序列。编码器和解码器都由多个相同的层次组成,每个层次包含多头注意力机制(Multi-Head Attention)和全连接前馈网络(Feed-Forward Network)两个子层次。该架构的优点是可以并行处理输入序列的所有元素,能够捕捉长距离的依赖关系,此架构奠定了大语言模型(LLM)的强大基础。生成式人工智能的基础架构是大语言模型。它是在大量数据集上进行预训PAGE 019练,且没有针对特定任务调整数据,另外可以对自然语言进行建模,以便于生成文本、语音识别、文本分类、机器翻译等任务。它的优点在于可以生成高质量的自然语言,同时还可以理解和处理复杂的语言结构。其路线主要分为三种:1)编码器路线;2)编解码器路线;3)解码器路线。三条线在发展初期都处于各自探索阶段,但2020年GPT-3模型的编译及其表现出的优异性能,解码器逐渐占据主导优势。同时模型闭源逐渐成为头部玩家的发展趋势,包括Google、OpenAI、META(原Facebook)等公司都在推进。在算法端,Transformer的自注意力机制是特殊情况下的注意力机制。在一般任务的编码解码(Encoder-Decoder)框架中,输入(Source)和输出(Tar-get)内容是不一样的,例如对于英中机器翻译来说,输入是英文句子,输出是对应地翻译出的中文句子。注意力机制发生在输出的元素Query和输入中的所有元素之间。而自注意指的不是输入和输出之间的注意力机制,而是输入内部元素之间或者输出内部元素之间发生的注意力机制,即“Target=Source”这种特殊情况下的计算机制。自注意力机制更容易捕获句子中长距离的相互依赖的特征,且对于增加计算的并行性也有直接帮助作用。OpenAI的GPT系列模型,均是基于Google提出的Transformer模型的解码器(Decoder)架构,每代模型仅对架构进行微调。从模型参数量和训练数据集维度看,在GPT-3模型之前,参数量和训练数据量均呈现快速增长态势,尤其是GPT-3模型参数量为1750亿,达到阶段性巅峰。最新框架中,指示学习(Instruction tuning)成为下一步发展的方式,其最早由2022年论文 Finetuned Language Models Are Zero-Shot Learners 提出论述。该模型需要学习如何在给定的输入条件下,输出与专家行为相似的结果,较类似于人类学习新技能的方式,例如观察和模仿专家的行为,从而逐渐掌握新的技能。此外,指示学习还可以避免一些传统强化学习方法中的问题,例如训练不稳PAGE 020CHAPTER 01AIGCCompliance DevelopmentWhite Paper定、难以收敛等问题。总结对比来看,大语言模型发展主要基于以下三大主要阶段:1)模型微调(Fine-tuning):以GPT-1为代表,需要大量的微调数据集样本,特定模型解决特定任务;2)提示学习(Prompt-learning):以GPT-3为代表,需要少量的微调数据样本,模型小样本学习(few-shot Learning)能力更强;3)指示学习(Instruc-tion-learning):以FLAN、InstructGPT、ChatGPT为代表,它可以通过模仿专家行为,快速地学习如何完成复杂的任务。C H A P T E R审中视外:生成式人工智能法律规制 的现行状况和发展动向 02PAGE 022CHAPTER 02AIGCCompliance DevelopmentWhite PaperPAGE 023S E C T I O N 0 0 1海外主要国家在生成式人工智能法律规制方面的现状和趋势人工智能作为现在主要发展的科技领域,其法律规制建设是一项全球关注的议题。各国在人工智能领域的立法历程具有其独特性,而这通常受其国家特性、科技发展情况以及伦理价值观的影响。1.美国美国政府自2016年起就开始关注人工智能的风险和监管问题。奥巴马政府在报告 为人工智能的未来做好准备 中提出“如果对人工智能的监管反应可能会增加合规成本,或减缓有益创新的开发或采用,政策制定者应考虑如何调整这些反应,以降低成本和创新障碍,而不会对安全或市场公平产生不利影响”。而后的2019年2月发布的 关于维持美国在人工智能领域领导地位的行政命令 中指出要在维护公民自由、隐私和美国价值观的前提下促进美国人工智能。在2020年1月,白宫发布规范人工智能发展及应用的监管原则,一份名为 人工智能应用规范指南 的文件,主张限制主管机关过度干预,并表示希望欧洲当局同样能够避免采取激进措施。2022年10月4日,乔拜登总统公布了 人工智能权利法案蓝图,概述了美国在人工智能时代应满足的五项原则,包括安全有效的系统,算法歧视保护,数据隐私,通知和解释,以及人工替代、考虑和后备。虽然该法案不具备强制性,但却从科技、经济以及军事等方面为美国人工智能发展提供指引。除此之外,两党立法者小组于2023年6月20日提出了一项名为 建立人工智能委员会,以及其他目的 的法案,旨在成立一个专注于人工智能监管的委员会。在生成式人工智能技术出现突PAGE 024CHAPTER 02AIGCCompliance DevelopmentWhite Paper破的情况下,尽管几位立法者敦促加强监管,华盛顿在很大程度上对人工智能规则将不予干涉。由此可见,美国政府对人工智能的态度倾向于鼓励发展和创新,同时尽量减少对AI创新的监管影响。2.欧盟欧盟在各类科技发展中的法律规制方面均走在全球前列,人工智能领域也是如此。2018年,欧洲委员会发布了 人工智能合作宣言,欧盟全部28个成员国参与了签署,而该“宣言”是一份涵盖人工智能在伦理、法律和社会经济等方面的全面合作和协调计划,明确了人工智能在欧盟的未来发展方向。2019年,欧盟委员会先后发布了 可信赖人工智能道德准则 和 可信赖人工智能的政策和投资建议,从技术稳健性和安全性、隐私和数据管理等多个方面为人工智能的可信赖性提供指引。2021年4月,欧盟委员会发布了一份名为 人工智能法 的草案,这是全球首份全面的AI法规草案,对AI的制造和使用设定了一系列严格的规定。而在2023年6月14日,欧洲议会全体会议表决通过了 人工智能法案 授权草案,该法案进入欧盟立法严格监管人工智能技术应用的最终谈判阶段。该法案草案的一个突出特点是注重基于风险来制定监管制度,以平衡人工智能的创新发展与安全规范。草案将人工智能风险分为不可接受的风险、高风险、有限的风险和极小的风险四级,对应不同的监管要求。欧盟在数据、隐私方面监管推行就表明其在监管政策上的积极性和严格性,同时也体现了其公共政策上对于个人安全和个人权利的重视。正如之前 通用数据保护条例 的推出引领了世界各国在相关领域的立法动作和参考,相信在人工智能领域,欧盟在创新发展和安全规范上的先进经验也会给其他各国带来新的思路。PAGE 0253.其它国家2023年3月29日,英国科学、创新和技术部(DSIT)发布了一份人工智能白皮书,旨在将英国打造为“人工智能超级大国”。该战略兼顾“监管”与“创新”,为识别和应对人工智能风险提供了框架。2022年4月22日,日本政府在第11届综合创新战略推进会上正式发布 人工智能战略2022,除了支持人工智能的发展外,也表明要与友好国家合作,共同制定和推广AI技术的伦理规则。但根据路透东京7月3日的报道,一位知情的官员表示,日本倾向于采用比欧盟更宽松的规则来管理人工智能的使用。加拿大、澳大利亚等国家都已经关注到了人工智能的风险,正在考虑潜在的监管措施,以及强化现有关于隐私、数据相关的法律法规,以加强对于个人的保护。而新加坡等国家则仍处于观望态度,仍希望优先以技术创新发展 。各国在人工智能规制建设中的主要活动和态度对全球人工智能产业发展以及个人权益保护产生深远影响。为了在鼓励创新的同时保障公众权益,各国需要持续跟进人工智能的发展,对其进行有效的法规制度建设。PAGE 026CHAPTER 02AIGCCompliance DevelopmentWhite PaperPAGE 027S E C T I O N 0 0 2中国在生成式人工智能法律规制方面的现状和趋势2001年7月16日,中国在GB/T 5271.28-2001 信息技术 词汇 第28部分:人工智能 基本概念与专家系统 的国家标准中首次指明了人工智能的定义,并在2022年10月12日发布的GB/T 41867-2022 信息技术人工智能术语 中明确人工智能的定义为“人工智能系统相关机制和应用的研究和开发”。人工智能在中国的发展已经过去了20余年。在此期间,人工智能技术在中国的应用场景逐步拓展,为中国的数字经济高速发展注入了新的活力。虽然在人工智能发展初期,中国对人工智能的监管处于相对空白的状态。然而,随着技术的发展,一系列与人工智能相关的法规已经开始涌现。如 中华人民共和国网络安全法、中华人民共和国数据安全法 等法规都包含了与人工智能相关的条款或内容。而为了更好地协调人工智能发展与治理的关系,2019年3月“国家新一代人工智能治理专业委员会”成立,并在同年6月发布了 新一代人工智能治理原则发展负责任的人工智能。此后在2021年9月,治理委员会进一步发布了 新一代人工智能伦理规范 以促进人工智能健康发展。自2022年起,随着生成式人工智能的突破进展和大面积应用,人工智能法律规制的制定开始提上日程。2022年12月9日,最高人民法院发布 关于规范和加强人工智能司法应用的意见,“意见”中明确到2025年,基本建成较为完备的司法人工智能技术应用体系,以及到2023年,建成具有规则引领和应用示范效应的司法人工智能技术应用和理论体系。同时,在“意见”中也明确了人工智能司法应用应遵循的原则。2023年3月,中国信通院正式发布了 生成式人工智能技术及产品评估方法,参与该标准编写工作的单位超过40家,其中不仅有百度、华为、腾讯等PAGE 028CHAPTER 02AIGCCompliance DevelopmentWhite Paper互联网龙头企业,亦有中国移动研究院、中国联通研究院等知名研究机构,可见生成式人工智能已然成为业内产品迭代的主要着力点。2023年4月10日,由国家互联网信息办公室公布的 生成式人工智能服务管理办法(征求意见稿)被视为全球首部针对生成式人工智能的立法草案,其对生成式人工智能的研发、利用有着重要的规范指引作用,且 生成式人工智能服务管理暂行办法 已于8月15日起施行。尽管该办法在整体结构和具体内容仍有优化的空间,但中国在此方面的努力显示出对新一代人工智能发展规划以及科学监管工作的高度重视。本文将在“条分缕析:生成式人工智能服务管理暂行办法 解读”中详细分析该管理暂行办法的指导性意义。在新一轮科技革命和产业变革深入发展的背景下,中国的人工智能发展已经进入到了一个全新的阶段。在未来,中国将继续完善人工智能的法规体系,更好地推动人工智能的健康发展。C H A P T E R履险蹈危:研判生成式人工智能的 演进和风险挑战 03PAGE 030CHAPTER 03AIGCCompliance DevelopmentWhite PaperPAGE 031生成式人工智能可以极大降低内容生产和交互的门槛和成本,在日新月异的高速发展中,有望带来一场自动化内容生产与交互变革,为各行业发展赋能。全览其发展趋势,可以归结为“亦巨亦微”。巨大模式是全模态和海量参数,是从大数据到全数据的发展趋势;小微模式是模型压缩和优化,力争在有限资源达成近似性能。2023年3月14日发布的GPT-4采用了更多更为丰富的训练数据,拥有更高的理解能力和更专业的判断水平,其预估参数相较GPT-3的1750亿参数量,增加了数十倍不止。同时,在确保保持高预测准确性的前提下,大幅度降低模型的大小和计算成本,优化计算效率,实现高效的模型预测,此类研发可以在较小的设备上进行研发。2023年3月,斯坦福发布了轻量级语言模型Alpace,该模型在LLaMA的基础上加入指令Alopace。其可以在笔记本电脑上进行部署,甚至可以在手机上进行运行,并且丝毫不会因为设备不同而影响其性能,依旧在性能方面可媲美GPT-3.5这样的超大规模语言模型。生成式人工智能虽然在众多行业中实现了革命性的突破,为业务带来了前所未有的便利与效率,但同时也伴随着一些不可忽视的风险。S E C T I O N 0 0 1生成式人工智能的创新和场景拓展动向生成式人工智能的创新和应用场景已经遍地开花,包括工业领域的设计、建模检测;医疗领域的药物发现、诊断治疗;教育领域的课程训练、智能助教;电商领域的商品定向推送、虚拟主播;传媒领域的新闻采集、快速剪辑;社交娱乐领域的人脸替换、智能抠图;创作领域的剧情脚本生成等。本节中针对主要拓展场景进行探讨。1.数字人技术的运用数字人,即运用数字技术创造出来的、与人类形象接近的数字化人物形象。2023年5月27日,在由北京市科协主办的中关村论坛中,一位特殊的数字人引起了公众的广泛关注这是“两弹一星”功勋科学家钱学森的数字形象。当“钱学森数字人”出现时,他友好地打招呼:“大家好,好久不见了!”这个数字形象不仅声音相近,其音容笑貌也高度还原了钱学森老先生。这一壮举是由中国科学技术大学网络空间安全学院与灵境赛博公司的联合团队完成的。他们采用了创新的“合成现实”技术,只依赖于几张已经泛黄的旧照片,成功地在数字领域重现了已故科学家的形象。在论坛的展示场景中,数字化的钱学森坐在他的书房内,微笑着与大家交流,还分享了他对“灵境”这个词的理解。值得一提的是,早在1990年,钱学森老先生就已经对虚拟现实技术(VR)表示出浓厚的兴趣,并为其提出了译名建议。团队负责人及中国科学技术大学网络空间安全学院的副院长张卫明感慨地说:“钱老当年关于 灵境 的很多想法,现在在很大程度上已经实现了,通过深度合成技术复原钱老,仿佛是跨越了时空。”张卫明还透露,这一数字化的钱学森形象未PAGE 032CHAPTER 03AIGCCompliance DevelopmentWhite PaperPAGE 033来将被用于教育领域,以传播科学文化给更多的人。这无疑是生成式人工智能技术的又一积极影响的现实体现。“这是个流行离开的世界,但我们都不擅长告别”,这句话出自 不能承受的生命之轻,该书的作者米兰昆德拉近日与世长辞,终年94岁。正如当代人无法再见到已逝伟人一样,我们的后代也同样面临着相同的情况,当人类历史不再局限于文字与短暂的影像,当后人可以身临其境般与历史人物面对面,那些原本枯燥的历史文字就被赋予了生命和情感,无疑为教育事业和文化传播带来了跨越性的突破。星愿航天的数字生命计划,致力于为唐氏综合征患者和自闭症患者建立数字人,帮助他们实现自己的梦想,提高社交能力,建立自信心,以及辅助康复。星愿航天利用数字复原技术为患者创建了一个数字化的“自我”,结合了先进的AIGC技术,使得患者能与其数字化的“自我”对话,这成为一种新的心理治疗手段。数字人技术为我们揭示了数字化人类的可能性,重塑了信息技术与生命之间的联系。2.金融行业的运用类似ChatGPT的基于生成式人工智能的技术应用,具备高度的自然语言识别和写作能力,能够根据特定的对话指令快速生成多种类型和风格的内容,包括纯文本、图文、精美的图片、动画、短视频等。不仅如此,随着对话的深入人工智能可更好地理解用户的意图,从而生成更加精准的内容。此类特性有助于不断发掘用户的深层需求。目前,生成式人工智能已成为金融行业中备受瞩目的技术之一,尤其在保险业中发挥了其显著作用。观察保险产品的设计至实施全流程,涉及众多信息收集、数据处理、精算和风险评估的步骤。这些过程中过去常依赖于繁琐的手动检索、计PAGE 034CHAPTER 03AIGCCompliance DevelopmentWhite Paper算和经验判断。但如今,尤其是健康险、寿险等人身险领域和财产险领域中,生成式人工智能模型独特的样本生成能力和场景泛化能力可以发挥巨大作用,将贯穿产品、营销、运营和客服等全流程,提供深度技术赋能。客户发掘和方案制定阶段,新保险产品的设计通常面临非结构化、半结构化数据的收集和处理问题。相对于传统的机器学习模型,即使面对非标格式的电子病历、医学文献和药物数据等内容,生成式大语言模型都可以大幅提高数据处理效率。借用智能客服等功能,通过“指令”、“提示”等少样本学习可以完成特定信息抽取、格式转化任务,多模态模型对图像、文本、音视频数据的融合处理能力可极大降低对人工标注数据的依赖。同时,样本信息抽取能力还可以转化为定制数据处理模型的训练数据标注来源,为后续工程构建更精准的小型模型。对于保险产品文档等物料生产环节,与抽取的非结构化、半结构化数据相对应,产品设计完成后可以直接形成保险范围、保险责任、费率表、免责约定等商务条款,快速生成对应的文档、图像宣传物料等。保险产品风险评估和精算预测阶段,凭借生成式人工智能生成的自然语言摘要、说明模型预测结果和变量权重等功能,可以快速提炼可视化的数据结果,更好解释并支持商业决策和产品设计。例如:分析健康险数据(含历史赔付数据、人口统计和医疗资料等),结合个人医疗历史和记录,在不同的场景下模拟赔付情况,以便更好地了解产品可能面临的风险和挑战,提升产品的可靠性和稳定性。保险投资阶段,可通过智能工具进行数据分析,提高风险控制能力,为投资组合决策提供参考意见。金融作为实效性要求最高的服务业,生成式人工智能的落地和不断学习发展将成为必然趋势,集中体现在金融类产品(SAAS、支付等)的入口重塑,同时在金 PAGE 035融垂类细分领域作为AI智能助手,提供更准确、有效、及时的信息。作为金融平台龙头,彭博社重磅发布为金融界打造的大型语言模型BloombergGPT,并构建了一个3630亿个标签的特定领域数据集FINPILE,训练专门用于金融领域的LLM,以支持金融行业内的各类任务。该模型在金融任务上的表现远超过现有模型,在NER(Named Entity Recognition)中排名第二。3.广告领域的运用当下短视频是传媒广告业最重要的阵地,生成式人工智能的运用从根本上改变了短视频营销的效率和效果。一个人,一台电脑,通过集成好的后台系统,可以做到每天发布1000多条15-20秒的营销短视频,极大提升累计曝光量并更精准定位目标客户。广告主需要准备的仅仅是日常业务中素材片段,通过“傻瓜式”架设摄像机持续录制视频,便可以通过生成式人工智能技术剪辑为成百上千条推广内容。集成后台自动收集意向客户的信息,根据算法调整客户跟踪和推送的策略,提示销售团队相应跟进。当然,简单粗暴的硬广固然会引起一些用户的不满,但生成式人工智能确实为广告行业带来了前所未有的效率提升,让广告内容创作、分发和客户管理的工作量大大减少,而产出却大大增加。4.办公及其他生产服务领域的运用办公软件是人员处理文本等内容的工具,而类GPT的AIGC技术大幅提升语言文本处理效率,提升办公效率与体验。以微软为例,其办公软件体系的AIGC技术接入主要包括AI+企业服务、AI+生产力工具、AI+沟通工具、AI+协作工具四个方PAGE 036CHAPTER 03AIGCCompliance DevelopmentWhite Paper来将被用于教育领域,以传播科学文化给更多的人。这无疑是生成式人工智能技术的又一积极影响的现实体现。“这是个流行离开的世界,但我们都不擅长告别”,这句话出自 不能承受的生命之轻,该书的作者米兰昆德拉近日与世长辞,终年94岁。正如当代人无法再见到已逝伟人一样,我们的后代也同样面临着相同的情况,当人类历史不再局限于文字与短暂的影像,当后人可以身临其境般与历史人物面对面,那些原本枯燥的历史文字就被赋予了生命和情感,无疑为教育事业和文化传播带来了跨越性的突破。星愿航天的数字生命计划,致力于为唐氏综合征患者和自闭症患者建立数字人,帮助他们实现自己的梦想,提高社交能力,建立自信心,以及辅助康复。星愿航天利用数字复原技术为患者创建了一个数字化的“自我”,结合了先进的AIGC技术,使得患者能与其数字化的“自我”对话,这成为一种新的心理治疗手段。数字人技术为我们揭示了数字化人类的可能性,重塑了信息技术与生命之间的联系。2.金融行业的运用类似ChatGPT的基于生成式人工智能的技术应用,具备高度的自然语言识别和写作能力,能够根据特定的对话指令快速生成多种类型和风格的内容,包括纯文本、图文、精美的图片、动画、短视频等。不仅如此,随着对话的深入人工智能可更好地理解用户的意图,从而生成更加精准的内容。此类特性有助于不断发掘用户的深层需求。目前,生成式人工智能已成为金融行业中备受瞩目的技术之一,尤其在保险业中发挥了其显著作用。观察保险产品的设计至实施全流程,涉及众多信息收集、数据处理、精算和风险评估的步骤。这些过程中过去常依赖于繁琐的手动检索、计算和经验判断。但如今,尤其是健康险、寿险等人身险领域和财产险领域中,生成式人工智能模型独特的样本生成能力和场景泛化能力可以发挥巨大作用,将贯穿产品、营销、运营和客服等全流程,提供深度技术赋能。客户发掘和方案制定阶段,新保险产品的设计通常面临非结构化、半结构化数据的收集和处理问题。相对于传统的机器学习模型,即使面对非标格式的电子病历、医学文献和药物数据等内容,生成式大语言模型都可以大幅提高数据处理效率。借用智能客服等功能,通过“指令”、“提示”等少样本学习可以完成特定信息抽取、格式转化任务,多模态模型对图像、文本、音视频数据的融合处理能力可极大降低对人工标注数据的依赖。同时,样本信息抽取能力还可以转化为定制数据处理模型的训练数据标注来源,为后续工程构建更精准的小型模型。对于保险产品文档等物料生产环节,与抽取的非结构化、半结构化数据相对应,产品设计完成后可以直接形成保险范围、保险责任、费率表、免责约定等商务条款,快速生成对应的文档、图像宣传物料等。保险产品风险评估和精算预测阶段,凭借生成式人工智能生成的自然语言摘要、说明模型预测结果和变量权重等功能,可以快速提炼可视化的数据结果,更好解释并支持商业决策和产品设计。例如:分析健康险数据(含历史赔付数据、人口统计和医疗资料等),- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2023 生成 人工智能 服务 合规 发展 白皮书
咨信网温馨提示:
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【Stan****Shan】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【Stan****Shan】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【Stan****Shan】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【Stan****Shan】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
关于本文