生成式AI报告.pdf
《生成式AI报告.pdf》由会员分享,可在线阅读,更多相关《生成式AI报告.pdf(37页珍藏版)》请在咨信网上搜索。
1、启明创投 未尽研究生成式 AI State of Generative AI 2023State of Generative AI 20232启明创投 未尽研究概要概要如果说 2022 年被称为生成式人工智能之年,扩散模型应用取得突破,ChatGPT 出世,一系列开创性的研究论文发表,2023 年则把大模型推向了一个高峰,GPT-4 的发布,标志着生成式人工智能,进入了面朝通用人工智能创新应用的阶段。应用、研究、监管,合力开辟着生成式人工智能的发展之路。创新应用生成式人工智能的生态包括了基础设施层、模型层与应用层,创新在每一个层面发起,竞争也在科技巨头、行业龙头和初创公司之间展开。在整个生态中
2、,受益于以参数规模为代表的大模型不断扩张,算力目前是最稀缺的资源,也处于最容易获利的要津。算力是大模型成本结构中最大的一块,GPU 的性能,决定了这个新兴行业的步调。但是,GPU 性能提升的速度,已经落后于大模型训练和推理需求的增长。面对这一革命性的技术,不论是主动还是被动,企业都被卷入其中。不管是技术的守成者、创新者还是采纳者,业务模式都将发生变化,进而影响企业的发展。当前,生成式 AI 尚处于技术发展的早期阶段,基础架构和核心技术并不成熟;科技巨头忙于研发大模型,尚未顾及深度切入具体的应用场景。但巨头何时添加相似的功能(feature)始终是悬在初创企业头上的达摩克利斯之剑,而大模型能力边
3、界的扩张也可能在未来挤占初创企业的发展空间,可以说,这是初创企业的蓝海,但也有发展道路上的暗礁。在中国,目前从模型出发的公司受到看好,通用大模型和垂直大模型的创业如火如荼,而自建模型的应用也在努力构建着自己的壁垒,同样,科技巨头正在利用自身算力优势来构建大模型。我们有理由相信,在众多模型层和科技大厂的合力下,模型层的整体能力将进一步完善,在未来为应用层企业提供可靠的支撑。前沿研究生成式人工智能领域的一个突出特征,是研究与创新过程的密切结合,许多在企业内部实现,迅速推出用例和产品。这种研究与创业的一体化,初创企业和风险资本起到了重要的作用,而美国科技巨头和主要人工智能企业的研究投入与人才,包括一
4、些底层技术的研究,这些年来已经超过了大学等研究机构。GPT-4 迸发出通用人工智能的“火花”,需要研究和解决的问题反而更多了,如信心校准,长期记忆,持续学习,个性化,规划和概念跨越,透明度,认知谬误和非理性,等等。而过去半年最重要的研究方向,是破解和理解大模型神秘而又令人兴奋的智能“涌现”。大模型既需要超越对下一个词的预测能力,也需要一个更丰富、更复杂的“慢思考”深层机制,来监督“快思考”预测下一个词的机制。大模型不仅用来生成文章和图片,而且可以用来当成智能代理,帮助管理和执行更复杂的任务。开源模型实现了低成本、小型化、专业化的训练,与闭源的基础模型竞争互补,共同推动了生成式人工智能技术的应用
5、,也加快了模型向边缘侧和移动端部署。生成式人工智能大模型日益向多模态发展,具身智能也成为一个重要研究方向,帮助生成式人工智能更好地理解和处理现实世界的复杂性和多样性。大模型更安全、让智能更可信,成为新兴的研究热点。生成式人工智能对于就业和经济的广泛影响,正在吸引经济学、社会学、心理学等不同领域的研究兴趣。但仍然需求实证性的研究。监管|安全|政策|人才生成式人工智能加快了中国、欧盟和美国的监管和立法的进程。欧盟努力在今年底让人工智能法案生效,为全球人工智能立法定下基调。中国也预计将于明年提出综合性的智能立法。而美国重点在于建立风险控制技术标准。中国对通用人工智能表现出很大热情与期待。地方政府中北
6、京、上海、深圳是第一梯队,均提出了较具雄心的人工智能科研、创新与产业目标。中国研究人员发布的论文在数量上已经超过了美国,但在金字塔顶端,无论是研究还是创业,美国仍然占据明显的优势。科技部要求人工智能企业,应该接受科技伦理审查;审查主体应该设立科技伦理(审查)委员会。美国人工智能企业较早开始设立负责任与可信人工智能部门,从去年到今年以来经过一些调整,反映出在生成式人工智能发生变革之际,企业正在寻求用更好的技术和方案,来安全和负责地部署新技术。十大前瞻基于上述研究,报告对未来一至三年的大语言模型、多模态模型和商业竞争态势,做出了十点前瞻。State of Generative AI 20233启明
7、创投 未尽研究目录生态架构生态位与新物种定价模型:基础设施层定价模型:模型层定价模型:应用层企业运营发生改变 市场格局GPT-3 之后的新公司大模型公司应用层公司语言类多模态目录致敬 2022大模型的“慢思考”开源智能代理多模态具身智能安全与可信中美欧监管地方的 AI 雄心安全与伦理中美塔尖人才从研究到创新十大展望关于报告0506070810111213151718192123242526272830313233343637第一章 行业变革第二章 前沿研究第三章 监管、安全与人才第四章 十大展望4启明创投 未尽研究第一章行业变革Artificial IntelligenceReport 202
8、3行业变革State of Generative AI 2023第一章:行业变革5启明创投 未尽研究生态架构AI 1.0 时代,需要针对特定任务,利用相关的数据研发特定模型,任务和模型耦合。AI 2.0 时代,经过大规模数据预训练得到的大模型,带来了极好的效果和泛化能力,可以直接被下游的各种任务使用。AI 2.0 的公司将分为三层:基础设施层:解决大模型训练/推理/部署的工具链厂商和提供 GPU 资源的智算中心。智算中心再往下是新一代AI 芯片或者下一代通用 GPU。模型层:研发大模型,并对外提供 AI 模型服务或者 API服务,包括训练(training)和推理(inference)时需要的
9、 GPU 资源。除了这类输出“水电”的底座大模型,也包括提供针对特定行业或场景的垂直模型的公司。应用层:专注于解决某个特定领域的应用公司,包括自研大模型的应用公司和利用第三方大模型的应用公司。生态架构四代底层技术的进步,催动了四波人工智能的发展。第一波小规模专家知识,用了 40 年走完;第二波浅层机器学习,用了 20 年走完;第三波深度学习,用了 8-10 年走完,并取得一定的成就。最近这一波 AI 新浪潮,以 2017年基于 Transformer 的预训练模型为起点,并在 2020 年 GPT-3 大模型发布后突破技术奇点。图中标红的企业为启明创投已布局企业。自建大模型的垂直应用Adept
10、,Runway,Character.ai,街远科技,无限光年,云知声利用第三方模型构建的应用Jasper,Descript,Copy.AI,TutorEva.ai应用层模型层闭源大模型及 API 服务Open AI,Cohere,Anthropic,百度文心,智谱 AI开源模型及 Model HubHugging Face,Stability,阿里云 Model Scope工具链AnyScale,MosaicML基础设施层智算平台Azure,AWS,阿里云,火山引擎,智算中心应用层State of Generative AI 2023第一章:行业变革6启明创投 未尽研究生态位与新物种生态位与新
11、物种在生态系统中,每一个物种都拥有自己的角色和地位,即生态位。处于不同的生态位,则指示了不同物种之前的合作和竞争关系。AI 2.0 的生态同样如此。新的“模型即服务(MaaS)”企业,以及自建模型、微调模型或调用 API 服务市场具体应用场景的企业,即这个生态中的“新物种”。这些新物种寻找着属于自己的新市场,同时为竞争做着准备。以下是一些对于这些新物种的观察:OpenAI 是“新物种”的代表,率先打造出具备涌现能力的大模型,激活了整个生态系统。这让在 AI 1.0 时代有所成绩的企业紧张,但又让更多的创业者与投资者兴奋。生成式 AI 的原生企业,它们遍布基础设施层、模型层和应用层。从提高研发和
12、使用模型效率的工具链企业,到致力于打造下一代模型的大模型公司,再到众多通用或着面向行业的应用公司,这些企业如火如荼的创新,为生成式AI 带来了无限活力。云巨头研发通用大模型,服务于自身业务,也对外开放API。微软旗下操作系统、生产力工具、企业管理系统、代码平台、安全套件都拥有了副驾驶(Copilot);百度要把每个产品重做一遍。同时,这些巨头还在开发自己的芯片,谷歌有了 TPU,微软则是雅典娜(Athena)。芯片厂商也在拓展自己的边界,英伟达针锋相对地推出了DGX Cloud,它还在强化赋能元宇宙(Omniverse)与大模型工厂(AI Foundations)的云平台。SaaS 巨头原本就
13、是基于云的应用,正在从大模型汲取新的动能。未来,绝大多数 SaaS 企业都会是包含生成式 AI功能的 SaaS 企业。彭博等行业龙头开始防御性地采纳自有大模型技术,也盯着基础模型的机会。此外,还有闭源与开源的路线,由于 License 的限制,开源模型并不一定可以商用,并且开源模型无法确保在未来一直迭代来匹敌闭源模型的效果。而基于闭源模型,很多企业又会担心未来的迭代可能受制于人。应用模型云芯片芯片巨头(英伟达)科技巨头(微软等)SaaS 巨头(Salesforce 等)行业巨头(彭博等)自建模型的应用利用第三方模型的应用MaaSGPUDGX CloudState of Generative A
14、I 2023第一章:行业变革7启明创投 未尽研究亚马逊选择了采购 A100 芯片,自己搭建数据中心,这虽然能够压低一些成本,但仍然使英伟达获利颇丰。年均成本:亚马逊 AWS 数据中心按五年线性折旧,年均4 万美元。服务定价:假定亚马逊 AI 算力出租的收入,全部来自p4d.24xlarge,它向客户提供 8 片 A100 算力性能的加速服务。(亚马逊目前还规模化提供基于英伟达 V100、自研 Trainium 等硬件的算力服务,此处选取当前最主流的 A100 为测算基准。)如果承诺一年内稳定的用量(Compute Savings Plans),且不提前预付费用,目前它的每小时价格为 24.21
15、 美元(美东俄亥俄的价格)。年均收入:如果客户一年 365 天一天 24 小时不停的租用算力,年均 21 万美元。该项服务的毛利率:那么,亚马逊该服务对应的毛利率将是 1-4/21=80.9%即如果生成式 AI 的生态持续扩展,市场繁荣,客户全年无休地渴求算力,那么亚马逊该项服务的毛利率最高可达80.9%。如果客户只有 50%的时间用到了它,那么 8 片A100 加速服务的年均收入就降到了不足 11 万美元,该项服务的毛利率就只有 1-4/11=63.6%,相当于外界预估的亚马逊云服务的总体毛利率。如果用户只有 20%的时间用到了它,那么收入只有 4 万美元,该项服务的毛利率为 0。事实上,A
16、I 算力目前是稀缺资源,AWS 正在极大受益。定价模型:基础设施层新的应用要有新的基础设施。AI 2.0 的基础设施是以提供智能算力为中心的智算中心。无论是模型还是应用,它都离不开硬件厂商或云服务商。GPU 是训练模型与加速推理的关键算力硬件。大模型还拔高了对数据中心带宽、数据存储的门槛。云服务商会采购各类硬件,辅以冷却系统与运维服务,构建灵活、可扩展的 IaaS平台,按需为客户提供算力。传统云巨头获利颇丰。设备定价:假定亚马逊直接采购英伟达组装好的 DGX A100 平台。它集成了 8 片 A100 GPU,配置了内存、CPU、网络等软硬件组件,初始售价 20 万美元。实际上,说明:基于硬件
17、 DGX A100 采购折旧价格与亚马逊 p4d.24xlarge 服务预购一年价格,未涉及运维与能耗等各种成本。未考虑不同地区不同时间的市场价格波动。未考虑承诺外用量的额外费用等。亚马逊云服务毛利率估算数据来自 Bear Stearns。假设所有机器都投入生成,仅根据用户的需求导致运转时间有差别,并未考虑有部分机器完全闲置的情况。例如所有机器都 50%的时间运转,而非 50%的机器完全闲置。定价模型:基础设施层亚马逊 AI 算力服务的毛利率,随客户需求提升而提升19284088977994100708591617682526773375864314958254355223446(%)90%8
18、0%70%60%50%40%30%20%10%0%客户全年无休地租用服务,该项服务的毛利率 80%。客户租用不足 50%,该服务毛利率 60%,相当亚马逊云整体毛利率。客户 AI 算力需求情况亚马逊该项服务的毛利率State of Generative AI 2023第一章:行业变革8启明创投 未尽研究定价模型:模型层 平均算力成本主要由 GPU 性能等决定,每 FLOP 的价格平均每 2.5 年下降 40%-50%。算力使用效率取决于软硬件优化水平等。据谷歌 PaLM 的论文,在训练阶段,缺乏优化经验或堆叠过多芯片,效率可能低至 20%,目前谷歌与 OpenAI 都能达到 50%左右。前述机
19、构推测目前推理阶段的效率在 25%左右。训练一次类似 GPT-3 的大模型,即 1750 亿参数规模,3000 亿 token,需要 6*1750*108*3000*108=3.15*1023FLOP 的算力需求。如果只用 1 片 V100,在 FP16 精度的28TFLOP的理论算力下,需要训练3.15*1023/28/(1*1012)/(365*24*60*60)=357 年;要缩短训练时间,就要增加硬件投入,但算力使用效率就会下降。租 用 云 服 务,亚 马 逊 刚 推 出 8 片 V100 算 力 的p3dn.24xlarge 时,预购一年(Savings Plans)每小时 18.3
20、美元。按 50%算力使用效率估算,在 2020 年时,训练GPT-3的成本约为357*(18.3/8)*365*24/50%=1430万美元。现实会复杂一点。不同云服务商的可用算力资源不同,价格也不同;大模型训练时长与并行多个模型同时训练的行为,也影响着算力使用需求。事实上,OpenAI 采购了 GPU,还得到微软支持,实际单次训练成本会比估算更低;但反过来,实际上训练一次是几乎不可能训练成功的,在大模型构建的过程中,存在着大量的失败和反复,此外为保证模型迭代的更快,需要进行大量的并行训练。即便打造出第一版大模型,后续模型的持续迭代的成本也无法避免。定价模型:模型层算力需求是模型层企业成本结构
21、中,占比最显著的一部分。其他还包括数据收集与预处理、MLOps 工具、能源消耗等。算力需求可分为训练与推理两大阶段。一些机构提出了各自的估算方式,它们可以用一个公式来简单概况:每参数每 token 的算力需求是常数,在训练阶段一般为 6 FLOPs,推理阶段则为 2 FLOPs。其他几项共同导致了不同模型的不同成本,是降低成本的重要方向。参考论文:Scaling Laws for Neural Language Models 与 Semianalysis 等算力成本训练成本推理成本训练数据的规模提示与问答长度参数规模平均算力成本算力使用效率每参数每 token 算力需求State of Gen
22、erative AI 2023第一章:行业变革9启明创投 未尽研究定价模型:模型层Publication dateSep 26,2010Jul 31,2014Apr 26,2017Jan 21,2020petaFLOP0.11101001,00010,000100,0001 million10 million100 million1 billionAlexNetAlexNetGANsGANsResNet-152(ImageNet)ResNet-152(ImageNet)TransformerTransformerBigGAN-deep 512x512BigGAN-deep 512x512BER
23、T-LargeBERT-LargeGPT-2GPT-2T5-3BT5-3BAlphaFoldAlphaFoldGPT-3 175B(davinci)GPT-3 175B(davinci)DALL-EDALL-ELaMDALaMDAPaLM(540B)PaLM(540B)VisionSource:Sevilla et al.(2023)Note:Computation is estimated based on published results in the AI literature and comes with some uncertainty.The authors expect the
24、 estimatesto be correct within a factor of 2.OurWorldInData.org/artificial-intelligence CC BY35 倍/18 个月摩尔定律(2 倍/18 个月)CPUGPU10 亿1 亿1000 万100 万10 万1 万10001001010.1训练算力(petaFLOP)随着 A100 逐步替换为 H100,推理成本也在下降。去年,OpenAI 的 gpt-3.5-turbo(4K context)的调用价格为 0.02美元/千 token。假定 GPT-3.5 的参数规模为 1750 亿,用户调用时,输入 500
25、 token 长度的提示词,获得 500 token 的内容输出,且这一推理过程完全基于 A100 实现,算力使用效率为 25%,那么单次推理算力需求为 2*1750*108*(500+500)=3.5*1014FLOP,单次推理成本为 19.22/8/(312*1*1012)/(60*60)*3.5*1014/25%=0.003 美元/千token,毛利率约为 1-0.003/0.02=85%。OpenAI 具有先发优势,为在竞争中赢得更多市场,它的定价策略更为激进。目前,同样的 API,服务价格以较去年下降了 90%,低于 0.002 美元/千 token。推出更多样的相对高价的 API
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生成 AI 报告
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【Stan****Shan】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【Stan****Shan】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。