AIGC算力时代系列报告-ChatGPT研究框架.pdf
《AIGC算力时代系列报告-ChatGPT研究框架.pdf》由会员分享,可在线阅读,更多相关《AIGC算力时代系列报告-ChatGPT研究框架.pdf(60页珍藏版)》请在咨信网上搜索。
1、2023年2月14日ChatGPT研究框架【AIGC算力时代系列报告】行业评级:看好证券研究报告分析师陈杭李佩京姚天航张建民研究助理安子超邮箱 邮箱证书编号S1230522110004S1230522060001S1230522010001S1230518060001 添加标题95%摘要2【芯片算力】芯片需求=量 x 价,AIGC拉动芯片产业量价齐升。1)量:AIGC带来的全新场景+原场景流量大幅提高;2)价:对高端芯片的需求将拉动芯片均价。ChatGPT的“背后英雄”:芯片,看好国内GPU、CPU、FPGA、AI芯片及光模块产业链。相关标的:海光信息、景嘉微、龙芯中科、中国长城、安路科技、复
2、旦微电、紫光国微、寒武纪、澜起科技、德科立、天孚通信、中际旭创。【深度学习框架】深度学习框架是人工智能算法的底层开发工具,是人工智能时代的操作系统,当前深度学习框架发展趋势是趋于大模型训练,对深度学习框架的分布式训练能力提出了要求,国产深度学习框架迎来发展机遇。相关标的:百度、海天瑞声、商汤科技、微软、谷歌、Meta。【深度学习大模型】ChatGPT是基于OpenAI公司开发的InstructGPT模型的对话系统,GPT系列模型源自2017年诞生的Transformer模型,此后大模型数量激增,参数量进入千亿时代,国内百度也发布了ERNIE系列模型并有望运用于即将发布的文心一言(ERNIE B
3、ot)对话系统,未来国内厂商有望在模型算法领域持续发力。相关标的:百度、科大讯飞、商汤科技、谷歌、微软。【应用】ChatGPT火爆全球的背后,可以窥见伴随人工智能技术的发展,数字内容的生产方式向着更加高效迈进。ChatGPT及AIGC未来有望在包括游戏、广告营销、影视、媒体、互联网、娱乐等各领域应用,优化内容生产的效率与创意,加速数实融合与产业升级。相关标的:百度、腾讯、阿里巴巴、网易、昆仑万维、阅文集团、捷成股份、视觉中国、风语筑、中文在线、三七互娱、吉比特、天娱数科。【通信】AIGC类产品未来有望成为5G时代新的流量入口,率先受益的有望是AIGC带来的底层基础算力爆发式增长。相关标的:包括
4、算力调度(运营商)、算力供给(运营商、奥飞数据、数据港)、算力设备(浪潮信息、联想集团、紫光股份、中兴通讯、锐捷网络、天孚通信、光库科技、中际旭创、新易盛)、算力散热(英维克、高澜股份)。mNpMqQpPyQpRsPmQoOmQpM8OcM8OmOoOoMmPjMqQtRiNmNnQ8OqRtPwMqMpMuOqRpN1、芯片算力3算力需求爆发拉动芯片量价齐升量价芯片需求光模块和光芯片AI芯片(加速器)GPUCPUFPGAAI光模块ChatGPT完美运行训练数据模型算法算力模型迭代Transformer技术算力需求增加英伟达GPU A100模型训练成本1200万美元AI训练计算需求预计每3.5
5、个月翻一番1万颗芯片需求快速增加芯片均价大幅提升通过AI服务器实现资料来源:浙商证券研究所4人工智能四层架构,芯片为底层支撑5底层芯片深度学习框架大模型上层应用CPUGPUFPGAASIC百度:PaddlePaddleMeta:PyTorch谷歌:TensorFlow华为:MindSporeOpenAI:GPT3.5华为:盘古大模型AIGCAI音乐:DeepMusicAI绘画:盗梦师AI写作:弈写ChatGPT百度:文心大模型谷歌:PaLM资料来源:澜舟科技,IDC,量子位,电子发烧友等,浙商证券研究所人工智能不同计算任务需要各类芯片实现资料来源:Huawei forum,浙商证券研究所CPU
6、GPUFPGAAI用ASIC通用性强,应用方便性能更优,能效更高强大的调度、管理、协调能力;应用范围广开发方便灵活 逻辑判断 任务调度与控制并行架构计算单元多适合大量逻辑确定的重复计算 模型训练成本低能耗低性能强针对AI设定特定架构 成熟量产阶段 研发阶段 数据中心 AI推理低延时开发周期短硬件可根据需求调整成本和壁垒高6ChatGPT流量激增,为AI服务器带来重要发展机遇7资料来源:Sensor Tower,World of Engineering,头豹研究院,华经产业研究院,浙商证券研究所原场景流量提升+新应用场景服务器算力要求提升AI服务器需求增加达成1亿月活跃用户耗时2个月9个月30个
7、月54个月60个月78个月史上用户增速最快消费级应用应用原场景流量提升创造新应用场景ChatGPT在问答模式的基础上进行推理、编写代码、文本创作等,用户人数及使用次数均提升。智能客服智能音箱陪伴型机器人游戏NPC内容生产传统CPU服务器通用性较强,专用性较弱数据的质和量发生变化,非结构化数据占比激增算力无法满足AI服务器需求终端用户使用频率提高,数据流量暴涨,对服务器的数据处理能力、可靠性及安全性等要求相应提升CAGR=18.8%122亿美元288亿美元20202025全球AI服务器市场规模ASICAI服务器快速增长,大力拉动芯片需求8资料来源:IDC,2022-2023中国人工智能计算力发展
8、评估报告,芯八哥,wind,浙商证券研究所整理0%10%20%30%40%50%60%70%80%90%100%2020202120222023202420252026训练推理GPU,89.0%NPU,9.6%ASIC,1.0%FPGA,0.4%新华三/HPE,15.6%戴尔,15.4%浪潮,8.9%联想,6.4%华为,1.1%ODM,35.5%其他,17.1%浪潮,30.7%新华三/HPE,17.5%戴尔,7.5%华为,7.4%联想,6.6%ODM,8.5%其他,21.8%中国人工智能服务器工作负载预测2021年全球服务器市场格局2021年中国服务器市场格局2022年中国人工智能芯片市场规模
9、占比AI服务器=?CPU+异构形式GPUFPGA或或AI服务器芯片构成CPU+加速芯片9CPU+加速芯片:通常搭载GPU、FPGA、ASIC等加速芯片,利用CPU与加速芯片的组合可以满足高吞吐量互联的需求自然语言处理计算机视觉训练(算力 30TOPS)推理(算力 30TOPS)计算(530TOPS)芯片种类优点缺点GPU提供了多核并行计算的基础结构,核心数多,可支撑大量数据的并行计算,拥有更高浮点运算能力管理控制能力弱,功耗高FPGA可以无限次编程,延时性较低,拥有流水线并行(GPU只有数据并行),实时性最强,灵活性最高开发难度大,只适合定点运算,价格比较昂贵ASIC与通用集成电路相比体积更小
10、,重量更轻,功耗更低,可靠性提高,性能提高,保密性增强,成本降低灵活性不够,价格高于FPGAAI服务器应用领域应用场景机器学习高度适配资料来源:华经产业研究院,亿欧智库,浙商证券研究所CPU擅长逻辑控制,可用于推理/预测0110资料来源:CSDN,浙商证券研究所整理控制单元存储单元运算单元控制指令数据整个CPU的指挥控制中心,由指令寄存器IR、指令译码器ID和操作控制器OC等组成。暂时存放数据的区域,保存等待处理或已经处理过的数据。执行部件,运算器的核心。可以执行算术运算和逻辑运算。运算单元所进行的全部操作都是由控制单元发出的控制信号来指挥。优势劣势作为计算机系统的运算和控制核心,是信息处理、
11、程序运行的最终执行单元。控制指令CPU有大量的缓存和复杂的逻辑控制单元,擅长逻辑控制、串行的运算。计算量较小,且不擅长复杂算法运算和处理并行重复的操作。在深度学习中可用于推理/预测取指令指令译码执行指令修改指令计数器CPU运行原理服务器CPU向多核心发展,满足处理能力和速度提升需要11资料来源:芯论语,半导体产业纵横,AMD官网,浙商证券研究所英特尔从单核到多核AMD从双核到96核200520102017奔腾D系列酷睿i7-980X酷睿i92020Lakefield史上第一个双核处理器首款6核处理器18核处理器首款采用混合架构的x86 5核处理器200520072018Athlon 64 X2
12、Phenom9500第二代锐龙Threadripper2020锐龙Threadripper3990X同一块芯片内整合两个K8核心首款原生4核处理器最大核心数量已达到32核拥有64核单核心CPU串行单任务处理“一心一用”分时多任务处理“一心多用”多核心CPU“多心多用”处理的任务更多、处理速度更快分时多任务处理系统性能优劣不能只考虑CPU核心数量,还要考虑操作系统、调度算法、应用和驱动程序等。2023Sapphire Rapids拥有56个核心2023霄龙9004核心数量最多可达96个95%GPU高度适配AI模型构建12AI模型构建(以英伟达A100为例)资料来源:英伟达官网,镁客网,腾讯网,浙
13、商证券研究所训练过程推理过程多实例 GPU(MIG)技术允许多个网络同时基于单个 A100 运行,从而优化计算资源的利用率。在 A100 其他推理性能增益的基础之上,仅结构稀疏支持一项就能带来高达两倍的性能提升。在 BERT 等先进的对话式AI 模型上,A100可将推理吞吐量提升到高达 CPU 的 249 倍;ChatGPT引发GPU热潮百度:即将推出文心一言(ERNIE Bot)苹果:引入AI加速器设计的M2系列芯片(M2 pro和M2 max)将被搭载于新款电脑OpenAI:随着ChatGPT的使用量激增,OpenAI需要更强的计算能力来响应百万级别的用户需求,因此增加了对英伟达GPU的需
14、求AMD:计划推出与苹果M2系列芯片竞争的台积电4nm工艺Phoenix系列芯片,以及使用Chiplet工艺设计的Alveo V70AI芯片。这两款芯片均计划在今年推向市场,分别面向消费电子市场以及AI推理领域GPU的并行计算高度适配神经网络GPU帮助高速解决问题:2048 个 A100GPU 可在一分钟内成规模地处理 BERT 之类的训练工作负载;0.7X3XV100FP161XA100 40GBFP16A100 80GBFP161X249XCPU Only245XA100 40GBA100 80GBFPGA:可通过深度学习+分布集群数据传输赋能大模型资料来源:ofweek,摩尔星球,C11
15、4,知识产权课堂,亿欧智库,浙商证券研究所FPGA可编程灵活性高:半定制电路,理论上可以实现任意ASIC和DSP的逻辑功能开发周期短:可通过设计软件处理布线、布局及时序等问题。现场可重编功能:可以远程通过软件实现自定义硬件功能。低延时:逻辑门通过硬件线连接,不需要时钟信号方便并行计算:集成了大量基本门电路,一次可执行多个指令算法深度学习通信接口异构计算、并行计算数据高速收发、交换推理Intel,AMD(Xilinx),亚马逊,微软,百度,阿里,腾讯AMD(Xilinx)训练Intel,AMD(Xilinx)/数据中心边缘端13ASIC可进一步优化性能与功耗,全球巨头纷纷布局14随着机器学习、边
16、缘计算、自动驾驶的发展,大量数据处理任务的产生,对于芯片计算效率、计算能力和计能耗比的要求也越来越高,ASIC通过与CPU结合的方式被广泛关注,国内外龙头厂商纷纷布局迎战AI时代的到来。国内外ASIC芯片龙头布局国外谷歌:张量处理器TPU国内最新的TPU v4集群被称为Pod,包含4096个v4芯片,可提供超过1 exaflops的浮点性能英伟达:GPU+CUDA阿里巴巴:含光800AI芯片硬件:自研芯片架构;软件:集成达摩院先进算法,可实现大网络模型在一颗NPU上完成计算。百度:昆仑2代AI芯片采用全球领先的7nm 制程,搭载自研的第二代 XPU 架构,相比一代性能提升2-3倍;昆仑芯3代将
17、于2024年初量产。华为:昇腾910业界算力最强的AI处理器,基于自研华为达芬奇架构3D Cube技术;主要面向大型数据密集型 HPC 和 AI 应用;基于 Grace 的系统与 NVIDIA GPU 紧密结合,性能比NVIDIA DGX 系统高出 10 倍;Habana(Intel收购)已推出云端 AI 训练芯片 Gaudi 和云端 AI 推理芯片 Goya;资料来源:机器之心,华为官网,半导体产业纵横,公开资料整理,浙商证券研究所数据传输速率:容易被忽略的算力瓶颈资料来源:Google Scholar,并行处理中节点间通信对加速比的影响,浙商证券研究所算力需求:超摩尔发展算力供给:芯片提升
18、+并行计算并行瓶颈:数据传输速率模型发布时间算力(FLPOs)深度学习之前深度学习时代大模型时代20个月翻倍(近似摩尔定律)5-6个月翻倍(远超摩尔定律)AI时代模型算力需求以超过摩尔定律增长数据中心通过交换机网络实现设备互联15理论加速比实际加速比通信延时导致加速放缓并行计算节点数加速比数据传输核心器件:光模块资料来源:中际旭创年报,光纤在线,电子发烧友,华经情报网,浙商证券研究所光模块电信数通数据中心内部数据中心互联骨干城域接入32.6%67.4%数据中心占光模块一半以上市场(2021Q4)发射器件接收器件电信号驱动电路激光器(内含光芯片)探测器(内含光芯片)放大器光纤传输电信号电信号光信
19、号电信号光模块包含发射器件和接收器件,光纤通信时的光电转换光模块向高速传输发展,以顺应数据传输量增长趋势161x9、GBIC1995-20002000-20102010-2020SFP、XFPQSFP、CFP、COBO2020之后QSFP-DD、OSFP-XD10G40G400G800、1.6T硅光技术相干技术光电共封装技术(CPO)服务器CPU需求增长,国化产三条发展路线17资料来源:IDC,wind,浙商证券研究所整理CISCX86架构RISCARM架构MIPS架构MIPS架构IP内核授权指令集架构授权授权+自主研制指令集龙芯中科申威科技上海兆芯海光信息华为鲲鹏天津飞腾自主化程度:低,未来
20、扩充指令集难度较大,但生态迁移成本小、性能高缺点:安全基础不牢靠自主化程度:较高,安全基础相对牢靠,拥有自主发展权缺点:生态构建较为困难自主化程度:极高,申威科技已基本实现完全自主可控缺点:生态构建极其困难中国服务器市场规模国产服务器CPU发展之路02000400060008000100001200020222023202420252026中国加速计算服务器市场预测(百万美元)服务器CPU市场格局AMD,9.80%英特尔,90.20%服务器CPU X86架构厂商份额未来算力升级路径:CHIPLET、存算一体18资料来源:知乎先进存算一体芯片设计(陈巍等),浙商证券研究所近期CHATGPT的兴起
21、推动着人工智能在应用端的蓬勃发展,这也对计算设备的运算能力提出了前所未有的需求。虽然AI芯片、GPU、CPU+FPGA等芯片已经对现有模型构成底层算力支撑,但面对未来潜在的算力指数增长,短期使用CHIPLET异构技术加速各类应用算法落地,长期来看打造存算一体芯片(减少芯片内外的数据搬运),或将成为未来算力升级的潜在方式。2016AlphaGo(DeepMind)2019AlphaStar(DeepMind)2018BERT(Google AI)2020GPT-3(OpenAI)2021AlphaFold2(DeepMind)2022Gato(DeepMind)CPUGPU未来:存算一体?202
22、3ChatGPT(OpenAI)游戏蛋白质结构大模型通用AI大算力未来:Chiplet?CHIPLET是布局先进制程、加速算力升级的关键技术19数据来源:芯智讯,浙商证券研究所能用能用够用好用13590nm6545nm28nm14nm7nm5nm3/2nm=+=123芯粒芯粒美国芯片法案ChipletChiplet芯粒+=功率模拟数字4G基站服务器L2+CPUGPUFPGAAI演算基带5GAI智能座舱L4+智驾AIGC、ChatGPT智能电车、无人驾驶智能座舱、VRARMR人工智能、5/6G手机+Chiplet异构技术不仅可以突破先进制程的封锁,并且可以大幅提升大型芯片的良率、降低设计的复杂程
23、度和设计成本、降低芯片制造成本。Chiplet技术加速了算力升级,但需要牺牲一定的体积和功耗,因此将率先在基站、服务器、智能电车等领域广泛使用。CHIPLET已广泛应用于服务器芯片20资料来源:各公司官网,浙商证券研究所添加标题添加标题Chiplet服务器芯片AMD:EPYC 第1代至第4代英特尔:第14代酷睿 Meteor Lake华为海思:鲲鹏920寒武纪:云端AI芯片思元370 Chiplet服务器芯片的引领者,4代产品采用5nm 基于chiplet 的第一代AMD EPYC 处理器中,装载8 个“Zen”CPU 核,2 个DDR4 内存通道和32 个PCIe 通道,以满足性能目标。20
24、22年AMD正式发布第四代EPYC处理器,拥有高达96颗5nm的Zen 4核心,并使用新一代的Chiplet工艺,结合5nm和6nm工艺来降低成本。首次采用 intel 4工艺,首次引入chiplet小芯片设计,预计将于23年下半年推出 至少性能功耗比的目标要达到 13 代 Raptor Lake 的 1.5 倍水平。基于7nm制程工艺,是寒武纪首款采用chiplet(芯粒)技术的AI芯片 集成了390亿个晶体管,最大算力高达256TOPS(INT8),是寒武纪第二代产品思元270算力的2倍。内存带宽是上一代产品的3倍,访存能效达GDDR6的1.5倍。采用7nm制造工艺,基于ARM架构授权 由
25、华为公司自主设计完成。典型主频下,SPECint Benchmark评分超过930。龙芯中科:龙芯3D5000(试验)面向服务器市场的 32 核 CPU 产品,通过Chiplet技术把两个 3C5000 硅片封装在一起,集成了32 个 LA464 处理器核和 64MB 片上共享缓存,22年末初样试验成功存算一体:打破“存储墙”限制,技术迭代演进21资料来源:知乎先进存算一体芯片设计(陈巍等),浙商证券研究所面对计算中心的数据洪流,数据搬运慢、搬运能耗大等问题成为了计算的关键瓶颈。从处理单元外的存储器提取数据,搬运时间往往是运算时间的成百上千倍,整个过程的无用能耗大概在60%-90%之间,能效非
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- AIGC 时代 系列 报告 ChatGPT 研究 框架
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【宇***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【宇***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。