2023年全球生成式AI产业研究报告.pdf
《2023年全球生成式AI产业研究报告.pdf》由会员分享,可在线阅读,更多相关《2023年全球生成式AI产业研究报告.pdf(31页珍藏版)》请在咨信网上搜索。
1、120232023年全球生成式年全球生成式AIAI产业研究报告产业研究报告2023 Global Generative AI Industry Report2前言前言生成式AI作为当前人工智能的前沿领域,成为全球最热的科技话题。2022年OpenAI发布ChatGPT,生成式AI在模型应用层面实现重要突破,仅两个月突破1亿月度活跃用户数,成为史上用户增长速度最快的消费级应用。全球多家科技企业加大在生成式AI领域的研发投入力度,不断在技术、产品及应用等方面推出重要成果,持续推动人工智能的创新与商业化落地进程,也将带动产业链相关企业快速发展。在此背景下,在中国互联网协会、中国软件行业协会指导下,天
2、津市人工智能学会、至顶科技、至顶智库联合发布2023年全球生成式AI产业研究报告,该报告从全球视角出发,对生成式AI的产业概况、基础设施、算法模型、场景应用、机遇挑战等方面进行梳理,全面展现生成式AI的产业发展情况,为政府部门、行业从业者、教育工作者以及社会公众更好了解生成式AI提供参考。天津市人工智能学会、至顶科技、至顶智库天津市人工智能学会、至顶科技、至顶智库第七届世界智能大会,中国天津,第七届世界智能大会,中国天津,20232023年年5 5月月2023.5 ZD Insights 3专家寄语专家寄语2023.5 ZD Insights 胡清华胡清华天津市人工智能学会理事长天津大学智能计
3、算学部教授人工智能的发展正在进入新的历史时期,生成式AI的未来充满着无限的可能性。ChatGPT的问世无疑是近年来人工智能领域最重要的技术突破之一。因此,我们必要全面了解人工智能技术的现状与趋势,探讨生成式AI的机遇和挑战,更好地迎接智能时代的到来。冯为嘉冯为嘉天津市人工智能学会秘书长天津师范大学计算机与信息工程学院网络工程系系主任杨巨成杨巨成天津市人工智能学会副理事长天津科技大学人工智能学院教授生成式AI作为全新的内容生产工具,必将改变人类的生活方式。随着技术不断进步和算法不断优化,未来生成式AI有望在办公、消费、文娱等各场景得到广泛应用,并在不同场景中降低创作者门槛,大幅提升内容生产效率。
4、伴随人工智能大模型的不断发展,生成式AI成为一个备受关注的前沿领域,将大概率改变人类与世界的互动方式。从程序设计到艺术创作,该技术正在为各行各业带来可能,有望持续推动社会的发展和人类文明的进步。王蕴韬王蕴韬中国信通院云计算与大数据研究所副总工作为近两年人工智能领域的发展热点,生成式AI引发社会广泛关注。未来,AIGC有关的内容生产工具将极大改变人们的工作生活方式,也将带来社会生产力的全面提升。在新技术新应用快速发展的同时,也需关注由此带来的就业、知识产权等问题,促进产业健康持续发展。4报告目录报告目录1.1.生成式生成式AIAI产业概况篇产业概况篇2.2.生成式生成式AIAI基础设施篇基础设施
5、篇3.3.生成式生成式AIAI算法模型篇算法模型篇4.4.生成式生成式AIAI场景应用篇场景应用篇5.5.生成式生成式AIAI机遇挑战篇机遇挑战篇5开篇:伴随人类文明进步和科技发展开篇:伴随人类文明进步和科技发展,语言的传播创造方式日益多元语言的传播创造方式日益多元语言作为人类沟通交流的主要方式,其发展历程分为三大阶段。语言语言1 1.0 0时代:时代:从人类语言诞生到公元前16世纪殷商时期甲骨文的出现,文字成为人类交流的重要方式;语言语言2 2.0 0时代:时代:从公元105年蔡伦发明造纸术到1946年世界第一台电子计算机诞生,语言开始通过各类机器实现传播;语言语言3 3.0 0时代:时代:
6、伴随互联网出现,人工智能NLP及生成式AI等技术的快速发展与相关应用落地,使得机器生成和创造语言的方式成为了可能。语言发展历经三大时代,生成式语言发展历经三大时代,生成式AIAI成为语言成为语言3.03.0时代的核心时代的核心语言语言1.01.0时代时代语言语言2.02.0时代时代语言语言3.03.0时代时代(公元前(公元前1010万年万年-公元前公元前1616世纪世纪)(公元(公元105105年年-2020世纪世纪4040年代)年代)(2020世纪世纪5050年代至今)年代至今)20172017年:年:TransformerTransformer架构架构提出,其在简单语言问答和语言建模任务上
7、有较好表现。20222022年:年:OpenAI发布ChatGPTChatGPT,成为生成式AI的里程碑事件。仅用2个月时间月活用户已突破1亿,成为史上增长最快消费者应用。资料来源:至顶智库结合公开资料整理绘制。2023.5 ZD Insights 公元前公元前1010万年万年:人类原始语言原始语言诞生,正式语言约产生于公元前4万年。新石器时代中期以后:新石器时代中期以后:中国出现象形文字象形文字。公元前公元前29002900年:年:古埃及人开始使用象形象形文字文字进行书写。公元前公元前1616世纪:世纪:殷商时期中国人创造甲甲骨文骨文。公元公元105105年:年:汉朝蔡伦发明造纸术造纸术。公
8、 元公 元 10411041-10481048 年 间:年 间:毕昇发明活字印刷术活字印刷术,为现代印刷术和印刷机的发展奠定基本原理。18371837年:年:美国人摩尔斯和两个英国工程师库克、怀斯顿同时发明电报电报。18761876年:年:贝尔发明第一部电话电话。19461946年:年:第一台电子计算机电子计算机在美国诞生。公元前公元前32003200-26002600年:年:楔形文字楔形文字经历诞生到持续使用。19501950年:年:艾伦图灵提出图灵测图灵测试试,标志着人工智能领域的开端。20102010年:年:IBM宣布开发名为 WatsonWatson系系统统,该系统能够理解自然语言中的
9、问题,然后使用人工智能根据维基百科提供的信息给出答案。20012001年:年:第一个神经语言模型,前馈前馈神经网络神经网络由Bengio等人提出。19691969年:年:互联网出现互联网出现,随着互联网商业化和全球普及,为更大规模语言语料数据获取及传输提供网络支撑。620232023年全球生成式年全球生成式AIAI产业研究报告产业研究报告1.1.生成式生成式AIAI产业概况篇产业概况篇71 1.1 1 生成式生成式AIAI概念及内容生成阶段概念及内容生成阶段生成式人工智能生成式人工智能(Generative(Generative AI)AI)是在专业生成内容(PGC)、用户生成内容(UGC)之
10、后,利用人工智能技术自动生成内容的新型生产方式利用人工智能技术自动生成内容的新型生产方式。生成式AI基于海量训练数据和大规模预训练模型,自动生成创建文本、音频、图像、视频以及跨模态信息。自2022年OpenAI发布ChatGPT以来,全球爆发生成式AI热潮,诸多科技类企业纷纷推出生成式AI模型、产品和相关底层基础设施及服务。内容生成分为内容生成分为PGCPGC、UGCUGC及及AIGCAIGC三大阶段三大阶段PGCPGC:专家创作时代:专家创作时代UGCUGC:用户创作时代:用户创作时代AIGCAIGC:生成式人工智能时代:生成式人工智能时代(2020世纪世纪9090年代年代)(2121世纪初
11、)世纪初)(2121世纪世纪未来)未来)20世纪90年代,基于“信息经济”的商业模式出现,互联网技术提供商提供技术服务,且从生产与组织内容的曝光中获得收益。门户网站门户网站、搜索引擎搜索引擎成为最主要产品。21世纪初,伴随微信微信、微博微博、抖音抖音、快手快手等众多社交媒体的出现,用户也可以真正参与到内容的创作之中,用户利用图文、短视频等多种方式记录生活点滴,同时也会增加人与人之间的交流与互动。2017 年,TransformerTransformer架构架构提出,其在简单语言问答和语言建模任务上有较好表现。2022年8月,美国科罗拉多州博览会,数字艺术类冠军颁发给由AI自动生成的画作太空歌剧
12、院太空歌剧院。2022 年 11 月,OpenAI 发 布ChatGPTChatGPT,成为生成式AI的里程 碑 事 件。2023 年 1 月,ChatGPT月活用户已突破1亿,成为史上增长最快的消费者应用。2023年3月,百度正式发布“文心一言文心一言”,推动国内生成式AI产品快速发展与落地。2023 年 3 月,NVIDIA在GTC23发布AIAI FoundationsFoundations,用于定制大语言模型和生成式AI。2023 年 3 月,微 软 发 布“MicrosoftMicrosoft 365365 CopilotCopilot”,将生成式AI与办公软件紧密结合,成为新的生产
13、力工具。资料来源:至顶智库结合公开资料整理绘制。2023.5 ZD Insights 8近年全球数据规模持续增长,IDC预计到2025年全球数据规模将达到175ZB,为人工智能模型训练提供海量数据资源;高性能AI芯片的推出为大规模预训练模型提供重要算力支撑;伴随技术的不断发展,Transformer、BERT、LaMDA、ChatGPT等模型实现快速迭代优化。在数据、算力和模型的共同推动下,全球生成式AI产业得以迅速发展,相关场景应用也不断丰富。1 1.2 2 生成式生成式AIAI产业发展驱动力产业发展驱动力334151658010113117527%24%24%27%23%26%30%34%
14、0%5%10%15%20%25%30%35%40%050100150200201820192020202120222023E2024E2025E全球数据量(ZB)同比增速全球数据规模持续增长全球数据规模持续增长算力呈现指数级上升算力呈现指数级上升数据来源:IDC,至顶智库信息来源:Compute Trends Across Three Eras of Machine Learning,至顶智库结合公开资料整理绘制2023.5 ZD Insights 20172017年以来年以来AIAI模型发展历程模型发展历程Google提出TransformerTransformer架构架构,其在简单语言问答
15、和语言建模任务上有较好表现。Google基于Transformer架构推出大推出大规模预训练模型规模预训练模型BERTBERT,其包含预训练和模型微调部分,查询准确率进一步提升。Google提出LaMDALaMDA模型模型,作为语言处理领域一项新的研究突破。LaMDA是一个面向对话的神经网络架构,可以就无休止的主题进行自由对话,克服了传统聊天机器人的局限性。OpenAI推出ChatGPTChatGPT,通过理解和学习人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流。OpenAI推出DALLEDALLE 2 2,不仅能通过文字描述创建特定风格的图像与艺术,还可以根据语
16、言对现有的图像进行编辑,使之更加逼真。OpenAI推出GPTGPT-4 4,其具备图像理解多模态能力。Google推出PaLMPaLM-E E,作为一种多模态VLM(视觉语言模型),不仅可以理解图像,还能理解、生成语言,执行各种复杂的机器人指令。资料来源:至顶智库结合公开资料整理绘制。201720172021202120182018202220222023202391 1.3 3 生成式生成式AIAI产业图谱产业图谱在中国互联网协会、中国软件行业协会指导下,天津市人工智能学会、在中国互联网协会、中国软件行业协会指导下,天津市人工智能学会、至顶科技、至顶智库至顶科技、至顶智库联合发布2023年全
17、球生成式AI产业图谱2023年全球生成式AI产业图谱。图谱主要分为基础设施层基础设施层(AI芯片、AI计算集群、AI云服务);算法模型层算法模型层(生成式AI大模型);场景应用层场景应用层(文本生成、图像生成、音频生成、视频生成、数字人)。图谱中涉及各领域全球代表性企业和相关机构,同时将其代表性产品或解决方案作相应展示,为读者提供更为详实的参考信息。2023.5 ZD Insights 101 1.4 4 生成式生成式AIAI商业模式商业模式目前,生成式AI尚未建立成熟的变现方式,大部分产品仍处于免费试用“流量吸引+平台改良”阶段。从全球情况来看,生成式AI的主流营收模式有如下几类:作为底层平
18、台收费作为底层平台收费、按产出内容收费按产出内容收费、软件订阅服务收费软件订阅服务收费、模型训练收费模型训练收费、具体属性收费具体属性收费。其中最具长期增长潜力,并将占据主要市场规模的模式为:作为底层平台收费。2023.5 ZD Insights 按产出内容收费按产出内容收费按产出内容量收费如图片张数、请求计算量等,适用于应用层变现,会受到具体属性影响。模型训练收费模型训练收费包括模型定制开发,适用于NPC训练等个性化定制需求较强的领域。具体属性收费具体属性收费例如版权授予、是否支持商业用途(个人、企业、品牌使用等)、透明框架和分辨率等。作为底层平台收费作为底层平台收费作为底层平台接入其他产品
19、对外开放,按照数据请求量和实际算量计算。软件订阅服务收费软件订阅服务收费向用户提供软件使用权,用户需要按月或其他频次支付费用。资料来源:至顶智库结合公开资料整理绘制。111 1.5 5 生成式生成式AIAI典型投资情况典型投资情况投资机构投资机构被投企业被投企业被投企业所在地被投企业所在地被投企业所属细分领域被投企业所属细分领域Sequoia Capital红杉资本OpenAIcopy.aiInVideo美国ChatGPT、GPT-4、DALLE 2等文本生成视频生成Insight PartnersJasper.ai美国文本生成Coatue ManagementStability AI英国图像
20、生成视频生成软银中国资本创新奇智中国奇智孔明AInnoGC工业预训练大模型创新工场澜舟科技追一科技中国孟子大模型;AIGC(智能创作)平台“博文”大模型高瓴投资小冰公司毫末智行中国数字人自动驾驶生成式大模型DriveGPT雪湖海若启明创投智谱AI中国ChatGLM-6B模型资料来源:IT桔子,至顶智库结合公开资料整理绘制。2023.5 ZD Insights 2019年以来,全球知名投资机构如Sequoia Capital红杉资本、Insight Partners、Coatue Management、创新工场、高瓴投资、启明创投等在生成式AI领域皆有所布局。从相关被投企业来看,美英生成式AI企
21、业侧重在场景应用领域,中国生成式AI企业侧重在大模型领域,被投企业如OpenAI、Stability AI、Jasper.ai、小冰公司、智谱AI、澜舟科技、毫末智行等。20192019年以来全球主要投资机构在生成式年以来全球主要投资机构在生成式AIAI领域的相关投资领域的相关投资1220232023年全球生成式年全球生成式AIAI产业研究报告产业研究报告2.2.生成式生成式AIAI基础设施篇基础设施篇132023.5 ZD Insights 人工智能的发展从深度学习时代进入到大模型时代,大规模预训练模型的参数量呈现指数级上升,需要高性能算力的支撑。目前,大规模预训练模型训练算力是以往的10到
22、100倍,当前主流生成式AI模型的训练广泛使用到英伟达Tensor Core GPU芯片,如微软斥资数亿美元购买数万颗英伟达A100芯片以帮助Open AI打造ChatGPT。2 2.1 1 AIAI高性能芯片为生成式高性能芯片为生成式AIAI训练提供算力支撑训练提供算力支撑对于AI超大模型训练,英伟达A100 80GB为每个节点提供高达1.3TB统一显存,吞吐量比A100 40GB多高达3倍。微软斥资数亿美元购买数万颗英伟达A100芯片,以帮助Open AI打造ChatGPT。结合OpenAI训练集群情况,GPT-3模型需要英伟达A100 GPU数量约3000-5000张,算力需求巨大。A1
23、00 Tensor Core GPUA100 Tensor Core GPU1X1X3X3X0 01X1X2X2X3X3XA100 40GBA100 40GBA100 80GBA100 80GB用于训练机器学习系统的算力近年呈现指数级上升用于训练机器学习系统的算力近年呈现指数级上升信息来源:Compute Trends Across Three Eras of Machine Learning,NVIDIA,至顶智库结合公开资料整理绘制。DALLE 2DALLE 2LaMDALaMDA1.E+241.E+231.E+221.E+211.E+201.E+191.E+181.E+171.E+161
24、.E+151.E+141.E+131.E+121.E+111.E+101.E+091.E+081.E+071.E+061.E+051.E+041.E+031.E+021.E+011.E+00195219541956195819601962196419661968197019721974197619781980198219841986198819901992199419961998200020022004200620082010201220142016201820202022训训练练算算力力用于AI训练的算力增长符合摩尔定律,大约每20个月翻一番。大模型出现,训练算力是原来的10到100倍。深度
25、学习的出现加速性能扩展,用于AI训练的算力大约每6个月翻一番。2022202220212021202020202019201920182018201320132014201420172017GPTGPT-3 3GPTGPT-2 2GPTGPT-1 1TransformerTransformerGAN GAN VAEVAE年份年份(FLOPs)FLOPs)深度学习时代深度学习时代大模型时代大模型时代14AI计算集群能够提供大规模算力、持续提高算力资源利用率、提升数据存储和处理能力,加速AI大模型训练和推理效率。当前较为典型的AI计算集群如英伟达DGX SuperPOD、百度智能云高性能计算集群E
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2023 全球 生成 AI 产业 研究 报告
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【Stan****Shan】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【Stan****Shan】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。