AIGC算力全景与趋势报告.pdf
《AIGC算力全景与趋势报告.pdf》由会员分享,可在线阅读,更多相关《AIGC算力全景与趋势报告.pdf(38页珍藏版)》请在咨信网上搜索。
1、AIGC AIGC 算算 力力 全全 景景 与与 趋趋 势势 报报 告告序序 言言2023年无疑是AIGC元年,ChatGPT引发的各类大模型竞赛中,行业内绕不开的一个话题便是算力从何而来。算力目前已经在AIGC产业内形成新共识算力成为AIGC发展的关键基石。随着英伟达今年一系列不断推陈出新的产品动作,可以看到国际上最先进的算力厂商如今已迈向由超级芯片组成的算力集群阶段。此外,算力厂商也无疑成为AIGC产业下的率先受益方。然而,随着大模型参数的不断增长,OpenAI近期表明算力成为其发展的挑战之一。在AIGC产业繁荣的当下,可以预见的是未来对算力的需求会越来越大。那么,在这场AIGC盛宴中,应
2、该如何应对当下面临的算力危机呢?在AIGC算力全景与趋势报告中,量子位智库将从我国算力产业现状、算力产业变革、趋势预判等角度出发,通过广泛调研与深度分析,全面立体描绘我国当前AIGC算力产业全景与趋势。我们期待,能够与众多投入、关注、期待中国AIGC算力产业的伙伴一起,共同见证并打造中国AIGC算力产业的蓬勃未来。AIGC驱动,算力产业机遇空前01020304目目 录录AIGC算力产业全景AIGC算力产业五新趋势AIGC算力产业周期预测05AIGC算力产业代表案例AIGC驱动,算力产业机遇空前01AIGC潮起,算力产业挑战巨大,机遇空前OpenAI发布ChatGPT属于GPT系列中的聊天机器人
3、模型。GPT系列中,GPT3是由1750亿参数组成的语言模型,而GPT4的参数更是达万亿级别。国内目前公布的大模型参数规模也普遍在百亿至千亿级别。如此庞大的参数规模,对于芯片提供商、云服务厂商以及服务器厂商都产生了新需求。全球范围内,GPT具备从底层改变各行业规则的能力,作为AIGC产业的基建,算力产业在未来有望成为一项公共服务渗透入各行各业。基于此,智算中心作为公共算力基础设施,成为AIGC基建中的关键环节。游戏规则被改写,MaaS能力成为竞争的关键变量云计算厂商 在算力需求暴涨、数据和模型资源稀缺、AI技术广泛落地背景下,智算中心成为地区AI新基建智算中心大模型训练驱动AI服务器需求暴涨,
4、并且正在催生新物种:AI模型一体机服务器厂商GPU为核心的AI训练芯片供不应求,是AIGC算力产业最大挑战和最大机遇芯片大模型参数量变化来源:Information is Beautiful芯片:大模型训练需求暴涨,GPU供不应求 需求当前大模型参数量在百亿至千亿参数规模,在训练阶段,对芯片的需求从CPU+加速器转变为以GPU主导的大规模并行计算。未来,当多数大模型参数规模到达万亿级别,将产生更大的算力需求。在单芯片性能之上,智算中心能够通过算力的生产-调度-聚合-释放,支持AI产业化发展。缺口目前市场对于英伟达芯片的需求远大于供给。经测算,一万枚英伟达A100芯片是做好AI大模型的算力门槛。
5、国内具备此量级的公司最多只有1家,而GPU芯片持有量超过一万枚的企业不超过5家。推理阶段(日常运营)ChatGPT 2023年2月官网总访问量 11亿次;用户每次与ChatGPT互动的云计算成本成为约0.01美元;保守预估,假设用户每次访问网站只进行一次互动训练阶段(单次成本)单次 GPT-3 Small(1.25亿)计算量 2.6PFlops/天 单次 GPT-3 XL 计算量为 27.5 PFlops/天 单次GPT-3(175B)计算量 3640 PFLops/天GPT3(175B)3640 PFLops:35000块 A100/1天 或 1024块 A100 跑 1个月单次训练成本:1
6、200万美元微调阶段预计算力1350.4 PFlops/天采用A100或V100设备算力需求13000块 A100/1天 或 433 块 A100 跑 1个月成本:920万/月芯片需求芯片需求芯片需求成本成本成本运营的算力成本:1100万美元/月来源:阿里公开资料,量子位智库整理服务器:业务增长显著,高端芯片AI服务器火爆 现状AIGC产业的发展将加剧AI服务器行业的增长速度,国产服务器厂商普遍业务增量在30%以上;国内市场中,服务器重新进入洗牌期。需求趋势由于AIGC对于高性能计算的需求,云厂商在服务器的选择上以AI服务器为主。据IDC数据,2025年全球AI服务器市场规模将达317.9亿美
7、元,年复合增长率为19%。英伟达GPU短期内面临产能不足问题,或将一定程度上限制AI服务器生产,从而影响出货量。010020030040050060070080020212025E20212021-20252025中国中国AIAI服务器市场规模预测服务器市场规模预测市场规模(亿元)数据来源:IDC,量子位智库整理28.10%17.20%10.10%6.20%5.30%5.10%4.90%6.10%17.00%20222022年中国服务器市场份额占比年中国服务器市场份额占比浪潮信息新华三超聚变宁畅中兴通讯戴尔联想ODM Direct其他50%50%云计算厂商:服务范式变革,MaaS带来新商业路径
8、 范式转变MaaS成为云计算服务的新范式,云计算判别标准从算力能力转向云智一体的AI产品能力。成本自研芯片:根据 IDC 2018年服务器成本结构数据显示,高性能服务器中,芯片成本占比高达 50%83%;全球头部云厂商(谷歌、微软、腾讯等)为摆脱过于依赖芯片厂商的局面,均加大芯片自研力度。工具与平台文心大模型EasyDL-大模型零门槛AI开发平台BML-大模型全功能AI开发平台大模型API大模型套件数据标注与处理大模型精调大模型轻量化大模型部署国网-百度文心能源浦发-百度文心金融行业大模型NLP大模型医疗 ERNIE-Health金融 ERNIE-Finance对话 PLATO搜索 ERNIE
9、-Search信息抽取 ERNIE-IE跨语言 ERNIE-M图网络 ERNIE-Sage语言理解与生成ERNIE 3.0 鹏城-百度文心 ERNIE 3.0 Zeus (百亿级)(千亿级)(任务知识增强千亿级)CV大模型文档图像表征学习VIMER-StrucTexT商品图文搜索表征学习VIMER-UMS多任务视觉表征学习VIMER-UFO自监督视觉表征学习VIMER-CAE图文生成ERNIE-ViLG跨模态大模型文档分析ERNIE-Layout视觉-语言ERNIE-ViL语言-语言ERNIE-SAT地理-语言ERNIE-GeoL生物计算大模型化合物表征学习HELIX-GEM蛋白质结构分析HE
10、LIX-Fold旸谷大模型创意与探索社区MaaS 产业结构图以百度文心为例企业方公共基建智能计算中心创新发展指南指出,在智算中心实现80%应用水平的情况下,城市/地区对智算中心的投资可带动人工智能核心产业增长约2.9-3.4倍,带动相关产业增长约36-42倍;未来80%的场景都将基于人工智能,所占据的算力资源主要由智算中心提供,智算中心将成为经济增长的新动力引擎。智算中心:基建级AI算力供应,打造地区经济增长新引擎阿里云张北超级智算中心、乌兰察布智算中心商汤科技人工智能计算中心百度智能云-昆仑芯(盐城)智算中心百度智能云(济南)智算中心腾讯长三角(上海)人工智能先进计算中心腾讯智慧产业长三角(
11、合肥)智算中心曙光5A级智算中心克拉玛依浪潮智算中心中国电信京津冀大数据智能算力中心中国联通广东 AI 智算中心全国超30座城市落地智算中心:北京、天津、河北、南京、无锡、宁波、杭州、武汉、沈阳、成都、哈尔滨、许昌、广州、宿州、乌镇、昆山、甘肃、长沙31.775155.2268427640.7922.81271.40500100015002019 2020 2021 2022 2023 2024 2025 2026百亿亿次浮点运算/秒(EFLOPS)来源:国家信息中心智能计算中心创新发展指南,IDC,量子位智库整理中国智能算力发展情况及预测中国智能算力发展情况及预测AIGC算力产业全景02AI
12、GC算力现状链路:芯片服务器云平台模型应用 外部:Azure云服务为ChatGPT构建了超过1万枚英伟达A100 GPU芯片的AI计算集群 内部:微软正在自研AI芯片雅典娜(Athena),将由台积电代工,采用5nm制程首个目标:为OpenAI提供算力引擎,以替代英伟达A100/H1001)Azure OpenAI 服务:企业级解决方案:借助 Azure OpenAI,用户可以汇总文本、获取代码建议、为网站生成图像等2)Microsoft 365 Copilot:使用了GPT-4作为其核心的LLM,将用户的自然语言输入转化为高效的生产力工具,集成在Word、Excel、PowerPoint、O
13、utlook、Teams等多个应用中以微软为例芯片资源微软是OpenAI唯一云服务提供商,为GPT训练提供计算资源、存储资源、自动化部署和管理等支持云基础设施平台Azure模型即应用(MaaS)专用芯片路线(Application-specific integrated circuit)通用芯片路线(Graphics processing unit)AI芯片目前有两大路线,一种是英伟达代表的GPU路线,更适合当前AIGC产业对大算力的需求,与AIGC大模型的训练及推理适配度极高。另一种路线则是以国内华为(主力产品)、寒武纪厂商为代表的专用AI芯片路线,此路线下的芯片更适用于垂类小模型,为其提供
14、能效比更高的芯片。此外互联网云厂商的自研芯片也是专用路线,芯片主要服务于自家产品,为自身产品打造性能更优的算力底座。芯片层现状:AIGC算力2大路线,GPU通用路线和AISC专用路线用来执行专门/定制化任务 专用场景中能够做到更优的能效比 跳出当前的已有生态,长期来看有可能实现真正超越优势局限 研发周期长、商业风险较大,产品易受市场变化影响 不易扩展,难以满足后续增加功能的需求能够完成多样化算力任务优势局限 擅长大规模并行计算 兼容英伟达生态,是最快也是最适用于当下的解决方案 在厂商被迫重复造轮子的前提下,追赶上英伟达的难度极高 芯片总体功耗高服务器作为算力的载体,是AIGC基础设施的核心硬件
15、。由于AIGC对于高性能计算的需求,云厂商在服务器的选择上以AI服务器为主。据IDC数据,2025年全球AI服务器市场规模将达317.9亿美元,年复合增长率为19%。AIGC产业的发展将加剧AI服务器行业的增长速度,国产服务器厂商普遍业务增量在30%以上;TrendForce日前发布预测,指出随着AI服务器与AI芯片需求同步看涨,预计2023年AI服务器(包含搭载GPU、FPGA、ASIC等主芯片)出货量将接近120万台,年增38.4%,并将2022-2026年AI服务器出货量年复合增长率上调至22%。2022年,国内互联网大厂成为AI服务器的最大买家;2023年,随着AIGC的爆发,根据业内
16、消息,互联网厂商依旧是AI服务器的最大买方。服务器层现状:AI服务器成主要增长点,采购占比互联网客户为主1212.51313.51414.51515.5202220232023AI服务器出货量预测13%13%19%17%16%14%6.00%2%1.50%1.50%22.70%2022年AI服务器采购量占比微软谷歌MetaAWS字节跳动腾讯阿里巴巴百度其他数据来源:TrendForce,量子位智库整理大模型成为MaaS的基座,MaaS所打造的商业模式也是大模型厂商的主要变现模式基于大模型产生有实际应用价值的产品。MaaS模式最早由阿里提出,随后互联网大厂、人工智能企业(如商汤)均已引入MaaS
17、模式。此外,互联网大厂、华为等企业已经将自研芯片用于MaaS底座构建中。云厂商是MaaS的提出者,也是主要参与方。MaaS模式基于大模型,能够最大限度消除大型企业数字化过程中规模化、标准化壁垒,降低企业部署难度;对于C端用户来讲,MaaS可在不同层级里产生价值,有望为云计算厂商带来新增长曲线。云计算现状:MaaS重塑服务模式,新老玩家重构竞争力基础大模型行业模型垂直领域模型L0L1L2API或模型压缩行业数据大模型训练和微调成本高,下游用户开发难度高通过MaaS赋能AI渗透率较低的行业云计算厂商承担训练和微调成本,提供MaaS服务MaaS服务提供商分时分次计费,按照用户的需求量核算投入产出从计
18、算设备分布来看智算中心是对原有数据中心的升级,其提供的首要是AI算力。具体来讲,智算中心提供包括算力、框架、模型,以及支持应用场景具体的基础设施,将不同层级进行打包,通过本地化部署完成智算中心建设。相比于数据中心,智算中心更贴近应用和产业方。智算中心现状:地域发展差异明显,东数西算成算力调度关键北京、广东、浙江、上海、江苏在服务器和AI服务器市场中居前五,市场份额总计分别达到75%和90%(2021年数据)。从供给角度来看AIGC算力需求主要来源为京津冀地区、长三角及大湾区。目前智算中心多分布在东部和中部省份,而AIGC业务需要处理海量数据导致东部算力资源成本过高。将大模型训练等对计算要求高的
19、任务移至西部地区,形成“东数西训”,能够有效降低成本,实现算网资源综合成本最优。具体来讲,针对算力需求供需不平衡等问题,需要通过算力调度将东部的算力和数据处理需求转移至成本较低的西部地区。其中,优化东西部之间互联网络和枢纽节点间直连网络是提升算力调度水平的关键。从需求角度看内蒙古枢纽宁夏枢纽甘肃枢纽成渝枢纽贵州枢纽粤港澳枢纽长三角枢纽京津冀枢纽天府集群重庆集群庆阳集群和林格尔集群芜湖集群韶关集群贵安集群中卫集群张家口集群长三角生态绿色一体化发展示范区集群东数西算整体规划AIGC算力产业全景图MaaS层云计算平台服务器厂商计算类芯片通用芯片专用芯片GPUCPUASICFPGA存储类芯片DRAMN
20、ANDNor FlashEEPROM3D NAND通义千问文心盘古日日新从容火山方舟言犀混元DSAAIGC算力产业五新趋势03机遇挑战芯片在AIGC算力产业中是最底层也是最关键的硬件产品。AIGC爆发,既是芯片厂商的一个重要分水岭,也将芯片厂商的目标重新聚焦于大算力方向。芯片作为算力直接来源,其发展逻辑是从应用端的需求出发,根据应用端所需要的算力特点提供相应的算力服务。在ChatGPT相关大模型爆发之前,国内芯片厂商一方面在做GPU布局,另一方面更多在满足垂直行业中的特定需求,且后者在国内市场更常见。此外,国产GPU厂商的设计初衷也多是按照推理芯片设计。在AIGC爆发后,对芯片的需求集中在训练
21、侧,并且对于训练芯片的算力要求极高,目前只有英伟达能够满足。然而,OpenAI 表示目前英伟达的产能已无法满足其更高的算力需求。未来,随着大模型参数量不断攀升,以及芯片制程走到尽头等问题,对于算力的定义将从单芯片性能逐渐转向超算/智算集群的计算能力。背景:算力供给趋于复杂,大规模运算需要系统级工程支撑国产处理器厂商的挑战与机遇 目前在高端AI芯片中,英伟达占据绝对优势,而英伟达的高端系列在中国只有存量没有增量。在芯片代工层面,目前优于7nm制程工艺没有对应的国产代工厂可以承接。硬件 业内普遍认为国产芯片在10年内很难突破英伟达的CUDA生态。软件市场将给予国产GPU厂商更多机会。国产GPU厂商
22、可选择成熟制程+先进封装的方案来达到与英伟达近似的性能指标。在服务器集群层面,通过高速互联技术实现高性能计算。目前国产芯片厂商采用两种路径:1)兼容CUDA生态;2)构建自身生态短期来看,兼容CUDA生态的厂商更适合为通用大模型提供算力。对于构建自身生态的厂商来说,其产品更适用于垂类小模型。趋势01新机遇:芯片竞逐高性能大算力,引入新计算架构大模型不同阶段对应不同的芯片需求需求方变化对芯片回归到最原始的需求模型需要大算力支持突破芯片算力性能硬件层面AI芯片厂商存算一体架构通过减少/消除数据搬运,降低功耗亿铸科技、后摩智能、知存科技等GPU厂商GPU+片间互联实现大规模并行计算海光信息、燧原科技
23、等软件/算法层面AI芯片厂商稀疏计算通过减少计算量,降低成本墨芯人工智能高性能网络RDMA互联高带宽接入,提升通信性能,缩短训练时长腾讯云星脉网络大模型训练阶段 芯片类型:GPU为主 芯片需求:执行大量矩阵运算和计算密集任务 GPU优势:高并发和浮点计算能力,可大幅提升训练速度 GPU劣势:功耗高、成本高大模型推理阶段 芯片类型:ASIC/FPGA/NPU与GPU均可 芯片需求:低延迟、低功耗(专用芯片更符合)专用芯片优势:更高的能源效率和计算密度 专用芯片劣势:缺乏通用性供给方变化技术趋势AI大模型对算力需求呈指数级增长,使得具有更高配置的AI服务器成为AIGC算力的主要载体。相比于传统服务
24、器,AI服务器的计算、存储以及网络传输能力能达到更高的水平。例如,NVIDIA DGX A100服务器 8 个 GPU+2 个 CPU 的配置远高于传统服务器 12 个 CPU 的配置。智算中心作为提供算力资源的公共基础设施平台,其算力机组以AI训练服务器和AI推理服务器为主。随着大模型训练阶段完成,未来AI服务器的主要需求将向推理侧转移。根据IDC的预测,到2026年,AIGC的算力62.2%将作用于模型推理。趋势02新增长曲线:AI服务器异军突起,红利曲线先训练后推理48.5%42.4%41.5%40.5%39.3%38.2%37.8%51.5%57.6%58.5%59.5%60.7%61
25、.8%62.2%0%20%40%60%80%100%2020202120222023202420252026中国AI服务器工作负载预测训练推理数据来源:IDC,量子位智库整理31.775155.2268427640.7922.81271.4020040060080010001200140020192020202120222023202420252026中国智能算力规模及预测单位:百亿亿次浮点运算/秒(EFLOPS)MaaS(模型即服务):在算力、算法和应用层中嵌入大模型,以智能底座集成应用并统一对外输出。MaaS的本质是将行业内通用的基础技术提炼整合成服务,满足各类应用场景需求;云计算服务能力
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- AIGC 全景 趋势 报告
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【Stan****Shan】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【Stan****Shan】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。