2023年GPU研究框架报告.pdf
《2023年GPU研究框架报告.pdf》由会员分享,可在线阅读,更多相关《2023年GPU研究框架报告.pdf(100页珍藏版)》请在咨信网上搜索。
1、请务必阅读末页的免责条款和声明2023年年2月月13日日计算机行业“构筑中国科技基石”系列报告25GPU:研究框架(100页)中信证券研究部计算机团队杨泽原,丁奇2核心观点核心观点核心结论:核心结论:GPU的核心竞争力在于架构等因素决定的性能先进性和计算生态壁垒。国内的核心竞争力在于架构等因素决定的性能先进性和计算生态壁垒。国内GPU厂商纷纷大力投入研发快速厂商纷纷大力投入研发快速迭代架构,推动产业开放构建自主生态,加速追赶全球头部企业。国产替代需求持续释放叠加国际局势不确定性加剧,迭代架构,推动产业开放构建自主生态,加速追赶全球头部企业。国产替代需求持续释放叠加国际局势不确定性加剧,AI&数
2、据中心、智能汽车、游戏等数据中心、智能汽车、游戏等GPU需求有望高增,国产需求有望高增,国产GPU迎来发展黄金期,我们看好国产迎来发展黄金期,我们看好国产GPU公司的发展与投资机公司的发展与投资机遇。遇。理解理解GPU的核心:性能先进性的核心:性能先进性+生态计算壁垒生态计算壁垒GPU物理性能取决于物理性能取决于微架构、制程、流处理器数量、核心频率等,微架构、制程、流处理器数量、核心频率等,其中微架构是核心点其中微架构是核心点。我们认为微架构的快速创新迭代是GPU性能领先的前提,其图形渲染单元和通用计算单元设计向着“更多、更专、更智能”的方向优化迭代。根据应用场景来划分,数据中心要求强算力、高
3、并发吞吐量;游戏业务要求浮点运算能力强、访存速度快;图形显示要求图显专业化、精细化等。生态:生态:GPU生态构筑通用计算极深壁垒,生态构筑通用计算极深壁垒,CUDA生态占据大部分市场,类生态占据大部分市场,类CUDA生态蓬勃发展生态蓬勃发展。GPU生态由上层算法库,中层接口、驱动、编译器和底层硬件架构三大部分基本构成。GPU研发难度在图形渲染硬件层面和通用计算软件生态层面,在IP、软件栈方面研发门槛较高,需要较长的积累,先发优势明显。CUDA生态从2006年推出至今,经过不断发展完善,几乎已在行业生态内处于垄断地位,目前ROCm等兼容Cuda的类计算生态蓬勃发展并处于快速推广阶段。海外复盘:海
4、外复盘:NVIDIA与与AMD(ATI)的竞争贯穿)的竞争贯穿GPU发展历程,架构创新升级和新兴发展历程,架构创新升级和新兴AI等领域前瞻探索是领跑的关键等领域前瞻探索是领跑的关键NVIDIA长期居于长期居于GPU市场领导地位,近年市场领导地位,近年AMD凭借凭借RDNA架构在游戏市场强势崛起。架构在游戏市场强势崛起。Verified Market Research数据显示,2022年全球独立GPU市场规模约448.3亿美元,NVIDIA和AMD的市场份额占比约为8:2。根据JPR数据,NVIDIA凭借自身性能领先和CUDA生态优势性始终占有GPU领域超50%的市场份额,数据中心业务更是全面领
5、先,在游戏显卡领域,近年AMD凭借RDNA系列架构强势崛起。NVIDIA先后与先后与AMD等企业在性能方面竞争博弈,架构创新升级和新兴领域前瞻探索是领跑等企业在性能方面竞争博弈,架构创新升级和新兴领域前瞻探索是领跑GPU行业的关键。行业的关键。NVIDIA凭借性能领先长期占据超五成市场份额,AMD(ATI)也曾因架构出色、性能惊艳实现反超。同时NVIDIA早在2006年前瞻性布局通用计算、构建CUDA生态,为如今AI&数据中心领域的全面领先构筑牢固的壁垒。NVIDIA积极布局异构芯片、汽车、元宇宙等新市场,寻找新的强有力业务增长点。pOoNsPmNtMvMpQtRqMoRmNbRbP9PmOr
6、RtRoNlOqQoMjMoPoN9PnMrNuOnQsONZnRqR3核心观点核心观点国内国内GPU市场:各应用场景市场广阔市场:各应用场景市场广阔,国内厂商大有可为国内厂商大有可为需求端需求端1AI:数据中心和终端场景不断落地对计算芯片提出更多更高需求。:数据中心和终端场景不断落地对计算芯片提出更多更高需求。新一轮AI对算力需求远超以往:ChatGPT类语言大模型底层是2017年出现的Transformer架构,该架构相比传统的CNN/RNN为基础的AI模型,参数量达到数千亿,对算力消耗巨大,对算力硬件有大量需求。甲子光年预测,中国AI芯片市场规模2023年达到557亿元。AI芯片可进一步
7、细分为云端和终端,中国云端芯片市场规模较大,甲子光年预计2023年增长至384.6亿元,对应复合年增速到52.8%;终端芯片市场规模甲子光年预计2023年增长至173亿元,对应年复合增长率达62.2%,伴随各AI终端落地预计将保持较快增长速度。需求端需求端2汽车:汽车智能化浪潮下域控制器汽车:汽车智能化浪潮下域控制器GPU市场前景广阔。市场前景广阔。自动驾驶和智能座舱是智能汽车中具有广阔前景的方向。盖世汽车数据预计,2025年自动驾驶域控制器出货量将达到432万台,每台自动驾驶域控制器配备1-4片高性能计算GPU;智能座舱域控制器出货量达到528万台,绝大多数智能座舱域控制器配备1片GPU。自
8、动驾驶技术不断提高和座舱进一步智能化拉动汽车GPU市场规模快速扩张。需求端需求端3游戏:游戏玩家人数持续增游戏:游戏玩家人数持续增长长,游戏,游戏GPU市场稳中有升。市场稳中有升。Newzoo Expert数据显示全球游戏玩家人数在2021年已达到30.57亿人,且预计2020-2025年全球游戏玩家人数复合年增率为4.2%;游戏市场内,游戏机和PC两大主体出货量再创新高,游戏机三大巨头2021年出货量高达4008万台;2021年Q4全球PC GPU出货量(包括集成和独立显卡)高达11000万片。投资建议投资建议:产业逻辑:产业逻辑:GPU的核心竞争力在于架构先进性能和生态丰富性,国产厂商正持
9、续大力投入研发实现GPU架构创新升级和快速迭代,力争赶超国际领先水平;同时构建与主流适配良好的生态环境,打造自主开放的软硬件生态和信息产业体系。投资建议:外部不确定因素叠加内部加速自主创新背景下,投资建议:外部不确定因素叠加内部加速自主创新背景下,国产国产GPU厂商厂商有望有望加速加速崛起。伴随崛起。伴随政策大力扶持、国际科技贸易政策影响、国政策大力扶持、国际科技贸易政策影响、国产厂商产厂商产品产品性能性能提升提升及及生态生态逐步逐步完善完善,国产,国产GPU龙头龙头正迎来关键发展机遇。正迎来关键发展机遇。1)推荐:海光信息()推荐:海光信息(CPU+GPGPU)。建议关注景嘉微、寒)。建议关
10、注景嘉微、寒武纪(电子覆盖)。武纪(电子覆盖)。2)一级市场(排名不分先后):关注壁仞科技、摩尔线程、沐曦、天数智芯、登临科技、燧原科技等。)一级市场(排名不分先后):关注壁仞科技、摩尔线程、沐曦、天数智芯、登临科技、燧原科技等。风险因素:风险因素:产业链安全风险;市场竞争加剧风险;商业需求不及预期风险;产品研发不及预期风险;国产替代进程不及预期风险;宏观经济产业链安全风险;市场竞争加剧风险;商业需求不及预期风险;产品研发不及预期风险;国产替代进程不及预期风险;宏观经济环境风险。环境风险。4报告亮点与创新之处报告亮点与创新之处第一,我们我们从性能和生态从性能和生态2个维度构建个维度构建了了GP
11、U完整完整的的研究研究体系体系。1)性能性能:决定GPU是否“高效”,其中微架构/制程是影响GPU性能的核心要素。2)生态生态:CUDA构筑通用计算坚固壁垒。第二,提出在评估提出在评估GPU性能的指标的重要性上:性能的指标的重要性上:微架构微架构、制程制程、流处理器数量流处理器数量、核心频率核心频率对对GPU性能影响性能影响较大较大。我们详细梳理了GPU的微架构、制程、显存容量/位宽/带宽/频率、核心频率等各类性能参数及重要性程度,并利用“核心数*核心频率*2”公式对性能算力进行量化,揭示可用3DMark、MLPerf 等GPU软件跑分进行相关性能测试评估。第三,详细拆解了详细拆解了NVIDI
12、A Fermi和和Hopper两大典型微架构的具体硬件实现两大典型微架构的具体硬件实现,在顶点处理、光栅化计算、纹理贴图、像素处理的图形渲染流水线上对Fermi架构进行了拆分;在指令接收、调度、分配、计算执行的通用计算流水线上对Hopper架构进行了简单易懂的描述,并指明更多、更专、更智能等未来架构升级迭代的方向。第四,明晰了生态是构建通用计算壁垒的基石明晰了生态是构建通用计算壁垒的基石。提出GPU研发难度在图形渲染硬件和通用计算软件生态层面,在IP、软件栈方面研发门槛较高,需要较长的积累,先发者优势明显。CUDA生态从2006年推出至今,经过不断发展完善,几乎已在行业生态内处于垄断地位。第五
13、,深度复深度复盘盘Nvidia/AMD(ATI)的的产品迭代和竞争产品迭代和竞争发展史发展史,通过对NVIDIA长期保持领先和AMD(ATI)反超进行总结得出结论:架构创新升级和新兴领域前瞻探索是领跑架构创新升级和新兴领域前瞻探索是领跑GPU行业的关键行业的关键。第六,梳理和测算了国内GPU在AI&数据中心、智能汽车、游戏行业的市场空间和发展趋势市场空间和发展趋势。目录目录CONTENTS51.理解理解GPU的核心:性能的核心:性能+生态生态2.他山之石:他山之石:Nvidia/AMD竞争启示竞争启示架构创新升级和新兴领域前瞻探索架构创新升级和新兴领域前瞻探索是主旋是主旋律律3.国内市场:国内
14、市场:GPU细分市场前景广阔,国内细分市场前景广阔,国内厂商大有可为厂商大有可为4.风险因素风险因素5.投资建议投资建议61.理解理解GPU的核心:性能的核心:性能+生态生态I.GPU:计算机图形处理以及并行计算的核心:计算机图形处理以及并行计算的核心II.性能:决定性能:决定GPU是否“高效”,其中微架构是是否“高效”,其中微架构是GPU性能领先的关键性能领先的关键III.生态:构筑通用计算壁垒生态:构筑通用计算壁垒7GPU全称全称是Graphic Processing Unit,即图形处理单元,是计算机显卡的核心。GPU是计算机的是计算机的图形处理以及并行计算内核图形处理以及并行计算内核。
15、它的主要功能可以分为:1)图形图像渲染计算 GPU;2)作为运算协作处理器 GPGPU。GPU的功能主要集中于执行高度线程化、相对简单的并行任务处理。GPU vs GPGPU:GPGPU全称通用GPU,运用CUDA及对应开放标准的OpenCL实现通用计算功能运算,能够辅助CPU进行非图形相关程序执行。由GPU性能拓展至计算密集领域,将GPU强大的并行运算能力运用于通用计算领域。多侧重科学计算、AI领域、大数据处理、通用计算、物理计算、加密货币生成等领域。资料来源:NVIDIA官网资料来源:搜狐十一号组织,中信证券研究部GPU内部架构内部架构1.1 GPU定位:计算机图形处理以及并行计算的核心定
16、位:计算机图形处理以及并行计算的核心GPU与与GPGPU对比对比GPUGPGPU主要执行任务图形渲染并行计算功能图形渲染、图形计算,对于游戏性能有关键影响多进行AI领域相关计算,科学计算和通用计算国内主要公司景嘉微、摩尔线程、象帝先、芯动科技、格兰菲、励算、深流微、芯瞳、绘智微壁仞、沫曦、登临、天数智芯、红山微电子、瀚博8依据接入方式不同分为:独立依据接入方式不同分为:独立GPU和集成和集成GPU。1)独立GPU:大部分封装于独立显卡电路板上,使用PCIE接口和特定显存,不受空间和供电限制,性能相对更好、渲染画质更佳。主要厂商包括AMD(Radeon系列)、NVIDIA(Geforce系列)。
17、2)集成GPU:通常未拥有独立显存,集成于CPU内部,与CPU共同使用Die和系统内存,节省空间占位和制作难度,价格较低、兼容性更佳且供电量少。主要厂商包括Intel(HD系列)、AMD(APU系列)。依据应用端不同分为:依据应用端不同分为:PC GPU、服务器服务器GPU和移动和移动GPU。1)PC端:集成GPU主要运用于提高轻办公效率,对性能要求较低;独立GPU主要运用于图形设计、提高图片制作清晰度以及3A游戏绘图渲染能力,对性能要求较高。2)服务器端:主要进行专业可视化处理、AI训练、AI推断的深度学习、提高计算运行能力以及视频编解码等功能,以独立GPU为主。3)移动端:提高游戏体验、提
18、升游戏处理性能,应用场景包括AR、桌面、云计算、数据中心等。受移动端功耗和体积限制,一般为集成GPU。资料来源:微信公众号GPU and Computing资料来源:微信公众号GPU and Computing独立独立GPU集成集成GPU1.1 GPU分类:应用于分类:应用于PC、服务器、移动端、服务器、移动端主要厂商及产品主要厂商及产品主要厂商主要厂商产品系列产品系列PC GPUNVIDIA、Intel、AMDXe LP、TITAN V 服务器GPUNVIDIA、AMDTesla、FireStream移动GPUImagination、高通、苹果、ARM、三星、华为、联发科PowerVR系列、
19、Adreno系列、公版Mali系列、Exynos、麒麟资料来源:NVIDIA官网,CSDNFinovy Cloud,中信证券研究部9GPU产业链主要包括三大环节:设计产业链主要包括三大环节:设计、制造和封装制造和封装。GPU整体商业模式包括三种:整体商业模式包括三种:IDM和和、Fab+Fabless和和 Foundry。IDM模式:指将GPU产业链的三个环节整体化,充分结合自主研发和外部代工,集设计、制造、封装为一体,公司垂直整合GPU整体产业链。Fab+Fabless:充分发挥各企业比较优势,仅负责芯片电路设计,将产业链其他环节外包,分散了GPU研发和生产的风险。Foundry:公司仅负责
20、芯片制造环节,不负责上游设计和下游封装,可以同时为多家上游企业服务。1.1 GPU产业链:产业链:设计设计制造制造封装封装GPU产业链产业链供给模式代表厂商供给模式代表厂商资料来源:华经情报网,各公司官网,中信证券研究部资料来源:IT智库,eefocus,中信证券研究部供给模式供给模式代表国外厂商代表国外厂商IDM英特尔、三星、TIFab+FablessNVIDIA、Apple、AMD、ARM、Qualcomm、华为、海思、MTK、BroadcomFoundry台积电、SMIC、UMC、Global Foundries芯片制造芯片制造封装测试封装测试芯片设计芯片设计10性能是衡量性能是衡量GP
21、U运行运行、执行命令高效的指标执行命令高效的指标。GPU物理性能评估主要在于比较各硬件的物理参数物理性能评估主要在于比较各硬件的物理参数。评估GPU物理性能的参数主要包括:微架构、制程、图形处理器数量、流处理器数量、显存容量/位宽/带宽/频率、核心频率。我们认为,评估GPU性能的指标依次为:微架构/制程流处理器数量/核心频率显存带宽/容量其他。1.2 GPU性能:衡量性能:衡量GPU“高效”的指标“高效”的指标资料来源:CSDNCharles Ren,NVIDIA官网,中信证券研究部GPU性能参数性能参数性能指标性能指标含义含义微架构GPU的硬件电路设计构造方式制程GPU的制造工艺和设计规则,
22、代表不同电路特性,通常以生产精度nm表示图形处理器单元数量包含了光栅单元ROP,纹理单元TMU的数量,数量越多可执行指令越多CUDA核数CUDA是执行函数的重要部件,CUDA核数越多,性能运行越好Tensor核数指张量处理单元的数量,Tensor Core核数越多,性能越好核心频率指显示核心的工作频率,能反映显示核心的性能优良显存容量显存容量越大,GPU能够处理的数据量越大显存位宽指显存在单位时钟周期内所传送数据的位数,位数越大瞬间传送数据量越大显存带宽等于显存频率显存位宽/8,与显存频率、位宽成正比显存频率反映显存速度,以MHz为衡量单位,越高端的显存,频率越高11微架构:微架构:又称为微处
23、理器体系结构,是硬件电路结构,用以实现指令执行。制程:制程:指GPU集成电路的密集度。在晶体管硬件数量一定的情况下,更精细的制程能够减少功耗和发热。现阶段GPU主流最先进工艺制程为5nm。核心频率:核心频率:代表GPU显示核心处理图像频率大小/工作频率,能够反映显示核心的性能。1.2 GPU性能影响因素:微架构、制程、核心频率性能影响因素:微架构、制程、核心频率GPU制程制程GPU微架构微架构资料来源:阿里云官网资料来源:半导体行业观察微信公众号12图形处理器单元数量:图形处理器单元数量:指GPU内部图形处理单元,涵盖光栅单元(ROP)和纹理单元(TMU)等数量。光栅单元(ROP):进行光线、
24、反射计算,负责游戏中高分辨率、高画质的效果生成。纹理单元(TMU):能够对二进制的图形进行一系列翻转、缩放变化,再将其纹理传输至3D平面模型中。CUDA核数:核数:作为GPU内部的流处理器,是主要的计算单元,CUDA核数越多,GPU性能等级越高。Tensor核数:核数:能够进行张量核加速GEMM计算以及加速卷积和递归神经网络运行,Tensor核数越多,在人工智能、深度学习领域的性能越强。1.2 GPU性能影响因素:图形性能影响因素:图形处理器单元数量、处理器单元数量、CUDA核数、核数、Tensor核数核数GPU Tensor CoreGPU CUDA Core资料来源:SHERLOCK资料来
25、源:NVIDIA A100 Tensor Core GPU Architecture白皮书13显存容量:显存作为显存容量:显存作为GPU核心部件核心部件,用以临时存储未处理数据用以临时存储未处理数据。显存容量的大小对于GPU存储临时数据的多少起决定性作用,在GPU核心性能能够提供充足支撑前提下,越大的显存容量能够减少数据读取次数,减少延迟出现。显存位宽:显存位宽:是GPU在单位时钟周期内传送数据的最大位数,位数越大GPU的吞吐量越大。显存频率:显存频率:显存数据传输的速度即显存工作频率,通常以MHz为显存频率计数单位。显存带宽:显存带宽:显存带宽=显存频率X显存位宽/8,为显存与显卡芯片间数据
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2023 GPU 研究 框架 报告
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【宇***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【宇***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。