运营商AI先进存力白皮书.pdf
《运营商AI先进存力白皮书.pdf》由会员分享,可在线阅读,更多相关《运营商AI先进存力白皮书.pdf(33页珍藏版)》请在咨信网上搜索。
1、运营商AI先进存力白皮书汇聚产业新动能,共创AI新时代汇聚产业新动能共创AI新时代-2023年-汇聚产业新动能,共创AI新时代汇聚产业新动能共创AI新时代-2023年-序 言人类社会正在跑步进入通用人工智能时代。从AlphaGo 到 ChatGPT,人工智能领域的里程碑事件不断涌现,GPT-4 首次展现极强的语义理解能力、内容生成能力和持续对话能力,这是一个新时代来临的标志。产业界纷纷加强大模型相关领域的研究,并推出一些新产品和新应用,传统信息产业生态正在被重塑。运营商作为 ICT 基础设施建设的主力军,迎来 AI 发展的新机遇。从对内网络业务角度看,大模型将会加速运营商网络智能化升级。首先,
2、利用人工智能的分析、策略优化与预测等能力来赋能网元、网络等业务系统,有助于提升电信网络的智能规建、智能运维、智能管控能力。其次,通过人工智能设计套餐,将人工智能嵌入用户流量管理中,有助于提升网络运营、市场营销、客户服务的效率。同时,借助大模型还可能对 6G 智简网络以及云网融合的研究提供帮助,促进 6G 技术迅猛发展。从对外政企业务角度看,大模型也将助力运营商赋能千行百业智能化升级。结合运营商的数据优势、算力优势、行业使能经验优势,运营商将成为数字经济智能化的关键一环。一方面,将运营商的大模型能力外溢至行业客户,面向政务、教育、医疗等推出行业大模型新应用,这也是当前运营商重点发力的方向。另一方
3、面,结合运营商算力、网络等资源优势,为大模型创业者和研发机构提供智算服务,做 AI 淘金时代“卖铲人”。运营商要抓住大模型的发展机遇,首先需要构建领先的 AI 基础设施,尤其是数据存储能力,也即存力。在大模型场景中,先进数据存力尤为重要。大模型的参数和数据规模都呈指数级增长,对存储的扩展性、稳定性、性能、时延等都提出更高要求。比如一个训练批次前后的数据加载和保存阶段,如果存取性能不足,会导致计算资源(如 CPU、GPU 等)的浪费。存力是算力价值的前提和基础,只有数据存得好、算得快、传得稳,整个 AI 基础设施才能够更好发挥算力的作用。本白皮书重点研究了运营商如何构建 AI 先进存力,一是分析
4、目前运营商行业 AI 场景的总体发展态势与应用现状,展望了运营商作为国家数字经济发展引擎的重要作用。二是分析支撑大模型应用的 AI 基础设施存在的挑战,分析得出 AI 先进存力是构建领先 AI 基础设施的关键一环。随着 AI 与通信产业的深度融合,AI 大模型不仅会赋能网络的泛在智能能力,还将助力运营商推动千行百业智能化升级。前行不缀,未来可期。通用人工智能奔涌而来,赋能数字经济的全面智能化升级。运营商引领时代潮流,智算底座将成为千行百业创新变革的重要基石。陈国良中国科学院院士在大模型席卷全球的热潮中,人们已经深刻认识到人工智能作为经济社会发展中一项革命性技术力量,将驱动全球产业实现巨大飞跃甚
5、至跨越式发展,深刻影响未来世界的竞争格局。通信行业作为信息通信基础设施的建设者和运营者,既为 AI 的发展提供基础设施支撑,又将会是 AI 应用落地的先行者。大模型时代,数据决定 AI 智能的高度。更多的训练数据是 AI 模型迭代升级的前提,更高的数据质量也决定着大模型训练的效果。国内要发展人工智能,并使这一产业得到高速的发展,一定要重视数据和信息的数字化记录。如今,国内建设了大量的数据中心,算力相对较多,但存力较少,很多高价值的信息都没有被记录下来。作为数据的载体,数据存储成为AI大模型的关键基础设施。构建 AI 先进存力是构建领先 AI 基础设施的核心条件之一。大模型的持续创新突破,需要从
6、数据的角度对 AI全流程进行优化。首先,数据归集阶段要高效处理多地域、多分支收集 PB 级多样化的原始数据;其次,在模型训练阶段需要对海量小文件的随机读取以及模型数据集快速保存;最后,在模型推理阶段需要快速检索增量源数据和向量数据。这些挑战都需要创新的 AI 存储解决方案,比如通过智能数据编织,实现跨系统、跨地域的全局统一数据视图和调度;通过近存计算,卸载部分数据预处理能力,减少数据搬迁,缩短数据准备时间;通过全闪存分布式存储,实现存储节点千万级每秒读写次数(IOPS,Input/Output Per Second)和数百 GB/s带宽,提升训练效率;通过向量存储,实现高性能向量检索能力。华为
7、公司在数据存储产业上的大规模投入超过十年,提供专业 AI 存储支撑大模型蓬勃发展,助力运营商引领新时代。通过与业界专家、客户和伙伴深入交流,中国移动研究院、中国联通、人工智能产业发展联盟、华为和中国科学技术大学联合编写了本白皮书。白皮书详细阐述了 AI 先进存力对运营商 AI 先进基础设施的支撑作用,建立了一套综合的评估 AI 先进存力的特征体系,可有效牵引对人工智能计算中心的科学规划。我相信这是一次非常有意义的探索,将凝聚更多的行业力量共同推进运营商 AI 产业的发展。凡人微光,汇聚成炬。华为愿与产业各方更加紧密携手努力,汇聚产业力量,共创运营商 AI 新时代。周跃峰 博士华为公司副总裁前
8、言图1 数据-模型-迭代全生命周期.03图2 AI大模型全流程存储需求分析.13图3 算力中心架构到存力中心架构.18图4 多业务接口的统一存储逻辑图.19图5 传统文件系统架构向并行文件系统架构发展.21图 目 录CONTENTS目 录AI 发展概述 011.1 AI 基本概念.011.2 AI 发展阶段.021.3 我国AI大模型发展现状.0401运营商是助推 AI 强劲发展主力军 052.1 运营商高度重视AI发展.052.2 运营商应用AI的主要方向.0902运营商 AI 存力挑战 113.1 AI存力是运营商发力大模型的基础.113.2 运营商AI存力面临的主要挑战.1303AI 先
9、进存力发展趋势 174.1 AI先进存力内涵.174.2 AI 先进存力关键技术.1804运营商 AI 先进存力产业发展建议 2505参考文献 2701AI 发展概述运营商 AI 先进存力白皮书AI 发展概述1人工智能(AI,Artificial Intelligence)是指通过计算机技术和算法模拟人类智能的一种技术。它可以让计算机像人一样思考和学习,从而实现自主决策的智能化行为。AI已在计算机视觉、智能语音、自然语言处理等应用领域迅速发展,开始像水、电、煤一样赋能于各个行业。AI 主要分为分析式 AI 和生成式 AI。传统分析式 AI 主要用于分析式应用,即对输入内容进行分析和判断,生成输
10、出分析结果,如推荐系统、图像识别、智能语音等。在传统的分析式 AI 时代,只能根据已有的数据进行学习和预测,无法处理新的、未知的情况。1.1 AI 基本概念02AI 发展概述运营商 AI 先进存力白皮书生成式 AI 主要用于内容生成,即使用 AI 生成新内容,如文本、图片、音频、视频等。生成式 AI 在学习归纳已有数据的基础上,学习数据产生的模式,并创造数据中不存在的新样本,实现了从数据分析到内容创作的跨越式发展,打开了 AI 应用新市场,已在文字创作、代码生成、图像生成等多场景实现了应用落地。自人工智能科学诞生至今 60 多年的发展历史过程中,人工智能经历了三次发展高潮,分别是1956 到
11、1970 年代,1980 到 1990 年代和 2000 年代至今。1959 年 Arthur Samuel 提出了机器学习,推动人工智能进入第一个发展高潮期。此后 70 年代末期出现了专家系统,标志着人工智能从理论研究走向实际应用。80 年代到 90 年代随着美国和日本立项支持人工智能研究,人工智能进入第二个发展高潮期,期间人工智能相关的数学模型取得了一系列重大突破。1997 年,IBM 深蓝战胜了国际象棋世界冠军Garry Kasparov,是一个里程碑意义的事件。这个时期的 AI 训练数据多为结构化数据,存储方式以本地盘存储形式为主。当前人工智能处于第三个发展阶段,2006 年加拿大Hi
12、nton 教授提出了深度学习的概念,极大地发展了人工神经网络算法。随后以深度学习、强化学习为代表的算法研究的突破,算法模型持续优化,极大地提升了人工智能应用的准确性。这个时期的 AI 训练数据多为文本、图片、音频等单模态数据,存储方式为本地盘或存储池形式的外置存储。1.2 AI 发展阶段03AI 发展概述运营商 AI 先进存力白皮书图 1-数据-模型-迭代全生命周期基础模型 L0科研机构行业模型 L1科研机构+行业伙伴细分场景模型 L2科研机构+行业场景化专家沉淀行业 Know-how违约风险识别3C 质检流行元素标注舞弊动机识别汽车制造巡检辅助设计财务异常检测纺织质检门店半定制+行业知识经验
13、反馈灵活适配细分场景 需求、数据、经验结构化表示沉淀反馈智 慧 医 疗自 动 驾 驶金 融 风 控近年来深度学习发展高潮迭起,Transformer 大模型的问世推动深度学习模型参数量从几万跃升至数千亿甚至更大,模型层数从开始的个位数逐步发展到成百上千,原始数据集也达到 PB 级,为满足大模型对存储的性能和容量需求,外置存储进一步升级为“性能型存储+容量型存储”。大模型实现了更好的泛化能力和更高的性能,正在成为 AI 发展的新范式。一方面,大模型实现了多场景覆盖、精度限制突破、泛化能力增强和研发能力自动化,成为了 AI 走向产业化应用的重要途径。另一方面,大模型也改变了 AI 模型的开发方式,
14、客户无需针对单个场景再开发单独的 AI 模型,而是由 AI大模型厂商开发基础的 L0 层模型,由行业 IT 供应商开发 L1 层的行业模型,应用场景 IT 供应商提供 L2层的细分场景模型。04AI 发展概述运营商 AI 先进存力白皮书自2020 年起,我国的大模型在数量和技术水平上都有明显提升,涵盖了智能语音、计算机视觉、自然语言处理等多个领域,并在能源、金融、航天、制造、传媒、城市、社科以及影视等领域应用落地。从大模型的布局体系来看,科技大厂在算力层、框架层、模型层、应用层进行了四位一体的全面布局。华为、百度均从芯片到应用进行自主研发的全面布局,如华为的“昇腾芯片+昇思框架+盘古大模型+行
15、业应用”、百度的“昆仑芯+飞桨框架+文心大模型+行业应用”。垂直行业企业和科研院所,主要以大模型算法研发和细分领域应用为主。从大模型参数量看,科技大厂和头部科研机构已上线的大模型参数量普遍在千亿级以上,如阿里通义千问大模型参数在 10 万亿级以上、腾讯混元大模型和华为盘古大模型参数量均在万亿级以上、百度文心一言大模型参数量在 2 千亿级以上,上海人工智能实验室书生浦语大模型参数量在千亿级别。从大模型业界评价看,国内大模型处于百花齐放状态。综合实力方面,头部科技大厂如华为、百度、阿里、腾讯等在大模型研发投入、技术能力和人才团队方面均有较强实力。商用推进方面,头部科技大厂均依托现有业务领域进行大模
16、型应用推广,更容易形成大模型的规模化应用。1.3 我国 AI 大模型发展现状05运营商是助推 AI 强劲发展主力军运营商 AI 先进存力白皮书运营商是助推 AI 强劲发展主力军2电信运营商作为 ICT 基础设施的建设者和运营者,拥有全国跨域网络互通、云网融合统一纳管的资源优势,也担当着全社会数智转型主力军的重任,因此在人工智能产业飞速发展的过程中,也在抓住新机遇加快构建新一代 AI 基础设施,提供澎湃算力、先进存力、品质运力,赋能千行百业。2.1 运营商高度重视 AI 发展06运营商是助推 AI 强劲发展主力军运营商 AI 先进存力白皮书中国移动在 2013 年开始人工智能领域战略布局,现已形
17、成从算法、平台、到规模化应用的产业级智能化服务能力。其九天平台已具备在计算机视觉、自然语言处理、智能语音、网络智能化等多领域的AI 能力,跻身央企“AI 国家队”。中国移动已发布九天海算政务大模型和九天客服大模型。依托九天海算政务大模型,政务服务系统将具备强大的政务事项理解能力、多维度的信息关联能力、面向复杂事项和复杂流程的多元交互能力。九天客服大模型既可根据用户提供的自然语言描述,解析用户问题并提供答案,又可以与人工客服协作,为人工客服提示回复建议,形成“大模型人工坐席用户”的三方沟通场,极大提升人工客服的工作效率。AI 技术也已经在中国移动的多个业务领域实现规模化应用,助力管理、服务等多方
18、面能力提升。例如智能客服月交互量从 5000 万提升至 2.1 亿,准确率达 92%;反诈骗系统月度拦截电话量超过 1400 万,准确率高达 98%;声纹识别防欺诈防骚扰电话准确率已达 98%。中国移动正在围绕智慧网络构建国家新一代人工智能开放平台,加速“通信网络+人工智能”的关键技术突破。一是围绕网络规划和运维业务,建设智能化仿真实验环境。利用人工智能技术,提供覆盖优化、多目标天线优化、大话务量业务保障、无线CSI 压缩及反馈等业务。二是面向社会开放多场景AI 基础设施,如对 ICT 企业、高校、科研机构、行业组织等提供算力、数据、算法、平台等资源。同时,中国移动在 2023 年 8 月发布
19、的中国移动NICC 新型智算中心技术体系白皮书中对“新存储-挖掘数据价值”做了详细阐述,通过计算与存储的交互过程总结出智算场景存储面临的性能,容量和调度关键挑战,最后提出多协议融合存储贯通异构数据,全局统一存储打破单体局限和基于计算总线构建统一内存池等解决方案。1.中国移动 AI 战略布局07运营商是助推 AI 强劲发展主力军运营商 AI 先进存力白皮书中国电信在 2019 年到 2020 年期间,确定了云网融合人工智能发展战略,先后发布了中国电信人工智能发展白皮书、云网融合 2030 技术白皮书,同时围绕业务中台、数据中台、安全中台、原子能力平台和云网技术底座提出“三中台一平台一底座”的数字
20、化平台顶层架构,明确了云网蓝图。基于云网融合优势以及天翼云多年的技术沉淀,中国电信推出智能计算平台“云骁”,提供智算、超算、通算多样化算力服务。依托天翼分布式架构云底座,“云骁”可提供软硬一体的解决方案,实现高阶算力供给、资源高效利用,助力行业数字化转型,降低企业创新成本。中国电信于近期推出星河通用视觉大模型 2.0,旨在为状态检测、动作事件、工业生产等场景提供服务。星河大模型参数量已从 10 亿提升至 100 亿,并融入图像、视频、语义多源信息,其语义理解能力、视觉感知能力、精细分割和空间交互关系能力均得到进一步提升。天翼云智能计算平台还为客户提供大模型训练和微调服务。通过“云骁”平台提供分
21、布式训练一站式解决方案,进一步缩短模型交付周期、提升 AI 训练开发效率。此外,针对技术合作伙伴,中国电信提出了“云创计划”,云存储是云创计划的 5 个领域之一。云存储重点解决多场景存储问题,聚焦数据存储搭建、融合存储合作。2.中国电信 AI 战略布局08运营商是助推 AI 强劲发展主力军运营商 AI 先进存力白皮书中国联通的 AI 应用战略包括两部分。一是对内提供智能化运营,如 5G+AI 智能运营平台,利用 AI提供网络故障定界问题能力。二是对外提供一站式创造服务,如一站式 AIGC(Artificial Intelligence Generated Content,人工智能生成内容)创造
22、工厂。中国联通已经发布鸿湖图文大模型 1.0,其具备以文生图、以图生图、视频剪辑等功能。随着移动互联网的快速发展,用户对于个性化、原创性的内容需求也越来越高,传统的图像、视频生成方式无法满足用户的需求,鸿湖图文大模型的推出填补了这一空白。通过该模型,运营商可以为用户提供丰富、有趣的图文内容,进一步提升其增值业务的竞争力和用户体验。鸿湖图文大模型的应用潜力巨大,可被广泛应用于媒体、广告、娱乐等多领域。媒体领域,鸿湖图文大模型可以帮助媒体机构高效、快速地生成新闻稿件配图;广告领域,鸿湖图文大模型可为广告公司提供广告创意和广告图像;娱乐领域,鸿湖图文大模型可以为用户创造丰富多彩的虚拟世界。联通还在全
23、力打造 uniVerse 元宇宙平台,推出一站式 AIGC 创作工厂联通元宇宙 AIGC 平台。该平台是联通面向 AI 商业落地布局的重要一环,包括 AI跨模态检索、AI图片驱动、AI音乐、AI主播、AI绘画、AIGC 3D 数字人等多种功能。此外,联通云7.0面向HPC/AI场景推出文件存储系统,目标是做 AI 时代的良田沃土。相对传统存储显著进步的地方有三点,一是更高的性能,包括高吞吐量以及部分计算场景下要求非常低的时延,以减少计算集群等待时间,让平台持续高效的运转;二是可扩展,AI 时代下,存储的性能可扩展、容量可扩展成为承接巨量数据、高增速、高性能计算要求下的硬性要求;三是多接口,包括
24、 POSIX、S3、ISCSI 等协议接口。3.中国联通 AI 战略布局09运营商是助推 AI 强劲发展主力军运营商 AI 先进存力白皮书AI 应用与运营商现有业务结合,实现业务效率提升。通信网络侧,AI 技术可以快速定位网络故障、简化网络优化流程,让运营商网络更加安全、稳定、可靠。客户服务侧,AI 技术可以帮助运营商更好地满足客户服务需求,增加客户参与度,提升用户体验。依托人工智能的语音识别、自然语言处理、人脸识别、知识工程等技术,运营商可以让 AI 技术与现有业务结合,大幅提升运营、运维效率,改善用户体验。1.对内融入现有业务,提升业务效率网络优化方面AI 能够在移动网络和固定网络“规-建
25、-维-优”的各个环节得到应用。网络智能配置方面,人工智能技术结合网络历史数据,将专家经验数字化,通过对网络性能的预测和自动化操作配置,有望实现移动站点智能规划、基站业务快速开通、智能路径规划和光传送网自动化部署等应用。网络智能运维方面,人工智能技术可实现物联网端到端质差识别定位、无线网络异常小区发现、IPRAN 故障分析定位等应用,可有效减轻运维人员负荷、提升运维故障处理效率。网络智能管控方面,人工智能技术可基于网络历史数据实现多种应用,如智能频谱管理、智能切片管理、智能负载均衡、智能缓存管理、智能路由、自适应传输功率控制与传输质量管理等。网络智能优化方面,人工智能技术可实现网络的主动优化和全
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 运营商 AI 先进 白皮书
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【Stan****Shan】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【Stan****Shan】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。