2024边缘计算AI推理技术场景与挑战.pdf
《2024边缘计算AI推理技术场景与挑战.pdf》由会员分享,可在线阅读,更多相关《2024边缘计算AI推理技术场景与挑战.pdf(36页珍藏版)》请在咨信网上搜索。
1、边缘计算 AI 推理技术场景与挑战 ODCC-2024-04001 1 边缘计边缘计算算 AIAI 推理技推理技术术场场景与挑景与挑战战 2024.09 发布 开放数据中心标准推进委员会 编号 ODCC-2024-04001 边缘计算 AI 推理技术场景与挑战 ODCC-2024-04001 II 编写组编写组 项目经理:项目经理:陈共龙 深圳市腾讯计算机系统有限公司 工作组长:工作组长:陈炜 深圳市腾讯计算机系统有限公司 贡献专家:贡献专家:李秋香 深圳市腾讯计算机系统有限公司 黄伟 北京百度网讯科技有限公司 黎正琛 北京百度网讯科技有限公司 郭利文 深圳富联富桂精密工业有限公司、张楠 富联
2、精密电子(天津)有限公司 张骏 英特尔 陈羿函 英特尔 任彤 中国信息通信研究院 常金凤 中国信息通信研究院 边缘计算 AI 推理技术场景与挑战 ODCC-2024-04001 III 前前 言言 在当今快速演进的技术时代,人工智能(AI)技术已成为推动工业、医疗和金融等领域革命性变革的核心力量。随着数据量的激增、计算需求的日益复杂化以及 AI 技术向大模型、多模态方向的演进,如何有效地部署 AI 模型以优化性能与成本,成为了企业和技术开发者面临的重大挑战。本文从探讨中心云和边缘计算节点在 AI 推理中的应用场景、优势、局限性出发,进一步深入分析 AI 推理在边缘计算节点产品中部署时遇到的挑战
3、以及未来的发展方向。边缘计算 AI 推理技术场景与挑战 ODCC-2024-04001 IV 目目 录录 版权声明.I 编写组.II 前 言.III 目 录.IV 一、AI 推理场景分析.1(一)中心云部署 AI 模型的典型场景分析.1 1.金融风险评估场景.1 2.文生图、文生视频等场景.3 3.中心云部署 AI 模型场景的特点总结.5(二)边缘计算节点部署 AI 模型的典型场景分析.6 1.多模态应用场景.6 2.智能交通与车辆智能.8 3.特点总结.10(三)边缘计算节点与中心云部署 AI 模型场景特点对比.11 1.模型类型.11 2.计算效率.11 3.数据传输.12 4.应用场景.
4、12 5.总结.12 二、边缘 AI 推理的挑战与需求.13(一)算力硬件层面挑战.13 1.有限的算力资源.14 边缘计算 AI 推理技术场景与挑战 ODCC-2024-04001 V 2.算力设备异构.14 3.功耗挑战.14(二)网络架构层面挑战.16 1.突发流量拥塞挑战.16 2.算力弹性组网挑战.17(三)算法层面挑战.19 1.量化的精度损失问题.19 2.模型剪枝的有效性与风险.19 3.微调与在线学习的适应性问题.19 4.跨模态数据处理挑战.20 三、未来技术趋势展望.20(一)可持续算力服务器.21 1.可持续 GenAI 系统架构技术.21 2.典型的可持续算力与液冷服
5、务器.23(二)边缘高性能、低延迟网络技术.25(三)算法层面未来潜在的趋势.27 四、总结.28 五、参考.30 边缘计算 AI 推理技术场景与挑战 ODCC-2024-04001 1 边缘计算边缘计算 AIAI 推理技术场景与挑战推理技术场景与挑战 一、一、AIAI 推理场景分析推理场景分析 (一)(一)中心云部署中心云部署 AIAI 模型的典型场景分析模型的典型场景分析 在当今的数字化时代,人工智能(AI)已经成为推动创新和业务转型的关键动力。将 AI 模型部署在中心云已成为一种成熟的做法,多年来持续发展。以下是一些通过中心云部署 AI 模型的典型场景,这些场景展示了如何利用云计算的优势
6、来推动 AI 技术的进一步发展和应用。1.1.金融风险评估场景金融风险评估场景 金融风险评估场景主要面向多种金融业务,包括银行、互联网金融、保险、证券、基金理财等领域。如,银行领域的贷款审批、信用评估、贷后管理等;互联网在线借贷平台的 P2P 借贷、消费金融等;保险业的保险承保、理赔审核等。腾讯云金融风控解决方案腾讯云金融风控解决方案旨在贴近金融业务场景,抓住典型风险类型,遵从风险管理流程,提供核心风控系统,为金融行业提供一站式的金融风控服务。该方案适用于银行、互联网金融、保险、证券、基金理财等多个金融业务场景,通过大数据和 AI 技术,帮助金融机构提升风险管理能力。边缘计算 AI 推理技术场
7、景与挑战 ODCC-2024-04001 2 图 1 腾讯云知识图谱风控系统 如图 1 所示,以腾讯云知识图谱风控系统为例,它为金融机构提供全量数据治理、知识融合、知识存储、知识计算和知识应用等技术和产品。它的优势包括:数据融合:数据融合:提供面向金融机构内外部数据的结构化和非结构化数据治理工具,高效治理和整合全维度数据,构造知识图谱数据模型。混合存储:混合存储:采用包含图存储、列式存储、索引存储、文件存储等技术的混合型数据存储架构,支持上亿级海量数据的高效存储和访问。智能分析:智能分析:整合自然语言处理、图计算、知识推理、机器边缘计算 AI 推理技术场景与挑战 ODCC-2024-04001
8、 3 学习等领先数据分析技术,对隐性关系、扩展属性、标签及子图进行大规模计算。知识图谱的典型模型包括图嵌入模型、图神经网络或者知识图谱补全模型等,参数量级从数百万到数十亿规模不等,对内存的需求在数 MB 到数 GB 之间。延迟响应方面的需求如下1:实时风险预警:实时风险预警:延迟需求在秒级(通常要求在 1 秒以内),比如,实时评估市场波动,提供风险预警。客户实时信用评估:客户实时信用评估:延迟需求在亚秒级(通常要求在 500毫秒以内),比如,在客户申请贷款或信用卡时,实时评估其信用风险。现有金融风险评估模型主要部署在中心云而不是边缘计算节点,主要原因包括以下几点:数据集中数据集中:金融机构的数
9、据通常集中存储,中心云能够方便地访问和处理海量数据,而边缘计算节点需要解决数据传输和存储的问题。数据处理能力数据处理能力:中心云通常拥有更强大的数据处理能力,这对于复杂的金融风险评估模型来说至关重要。2.2.文生图、文生视频等场景文生图、文生视频等场景 文生图和文生视频这类应用通常指的是能够根据用户输入的文本描述自动生成图片或视频的软件或服务。这些应用使用人工智能技术,特别是深度学习中的生成对抗网络(GANs)或变分自编码器边缘计算 AI 推理技术场景与挑战 ODCC-2024-04001 4 (VAEs)等模型,来理解文本内容并将其转化为视觉内容。这些应用在艺术创作、游戏设计、电影制作等领域
10、有着广泛的应用前景,它们可以帮助用户快速实现创意视觉化,节省传统创作过程中的时间和成本。比如,以百度智能云为例的文生图/视频的架构如下:文本预处理层文本预处理层:首先对输入的文本进行分词、语义解析等处理,确保文本内容能够被 AI 模型准确理解。AI 模型处理层模型处理层:通过训练好的大规模文生图/视频生成模型(如 Transformer 或 GAN 网络)接收预处理后的文本输入,根据文本的语义和风格指令,生成相应的图像或视频。渲染渲染与优化层与优化层:生成的原始图像或视频帧可能会进行进一步的渲染和后期处理,包括颜色调整、分辨率增强、画质优化等,以保证输出结果的视觉效果和逼真度。在百度智能云上部
11、署的主流模型主流模型包括包括:文图生成模型文图生成模型:专门训练于文本到图像的任务,能够从广泛的数据库中提取和合成元素以形成新颖且相关的图像。视频生成视频生成 GAN 模型模型:使用生成对抗网络(GANs)结构,其中一个模型负责生成视频,而另一个则尝试识别假视频与真实视频的差异,通过这种方式不断改进生成的视频质量。考虑到文生图和文生视频任务对模型的复杂度和深度需求极高,部署在百度中心云的模型参数规模通常非常大,可达数十亿乃至数千亿级别。例如,像 ERNIE 3.0 Titan 这样的大规模语言模型,在用于图边缘计算 AI 推理技术场景与挑战 ODCC-2024-04001 5 像和视频生成的扩
12、展时,也会相应增加网络层的深度和广度。同时,GAN 模型也可能包含多个子网络和生成器-判别器对抗机制,导致总参数量进一步上升。文生图、文生视频等场景部署在中心云的理由如下:强大的计算资源强大的计算资源:文生图和文生视频生成过程需要大量并行计算,而中心云能提供强大的计算能力支持,包括 GPU 加速和专用的 AI 算力实例,以满足复杂模型的训练和推理需求。丰富的存储空间丰富的存储空间:生成的海量图像和视频需要充足的存储空间,云对象存储(BOS)等服务能够提供高可用性和高吞吐量的数据存储方案,保障数据安全且访问快速。3.3.中心云部署中心云部署 AIAI 模型场景的特点总结模型场景的特点总结 算力强
13、大:中心云拥有庞大的计算资源,能够处理大规模数据和复杂计算任务。数据管理集中:所有数据都在中心云进行存储和管理,便于统一监控和维护。成本分摊:多个用户共享中心云的资源,降低了单个用户的成本。实时性受限:由于数据传输和处理的延迟,中心云部署的AI 模型在实时性方面可能不如边缘部署。边缘计算 AI 推理技术场景与挑战 ODCC-2024-04001 6 (二二)边缘计算节点边缘计算节点部署部署 AIAI 模型的典型场景分析模型的典型场景分析 在数字化和智能化迅速发展的今天,人工智能(AI)应用已渗透到生活的各个方面。多模态应用场景通过结合图像、视频、音频和文本等多种数据类型,利用 AI 技术进行综
14、合分析和处理,极大地拓展了 AI 的应用范围和深度。这些应用不仅包括 AI 辅助的代码生成、健身与教育,还扩展到智能交通和车辆智能等领域。这些技术的实现往往依赖于高效的数据处理和快速的响应速度,因此,边缘计算节点部署成为了一个理想的选择。边缘计算节点部署 AI 模型能够将数据处理和分析的过程从中心云转移到用户近端的边缘设备上,这样做有多重优势:首先,它可以显著降低延迟,对于需要即时反馈的应用场景尤为关键;其次,它能提高带宽效率,减少中心云的数据传输需求,节约资源;再次,边缘计算的部署增强了系统的可靠性,即使在网络不稳定的情况下也能保持服务的连续性;此外,边缘 AI 支持实时数据处理,加快了决策
15、和响应速度;最后,它还有助于降低整体的运营成本。其中,本文提到的边缘计算节点包括边缘云、现场边缘设备等。在接下来的章节中,我们将深入分析边缘计算节点部署 AI 模型的典型场景,探讨这种技术布局如何有效支持复杂的多模态应用,并在现实世界中发挥其独特的优势。通过具体案例,我们可以更好地理解边缘 AI 如何在不同领域内实现创新和提升效率。1.1.多模态应用场景多模态应用场景 边缘计算 AI 推理技术场景与挑战 ODCC-2024-04001 7 多模态应用场景指的是利用多种类型的数据(如图像、视频、音频、文本等)进行综合分析和处理,以实现更复杂和智能的应用。这些场景通常结合了计算机视觉、自然语言处理
16、和音频处理等多个领域的技术,通过多模态大模型(Multimodal AI Models)来处理和理解不同类型的数据,从而提供更全面和准确的结果。典型的应用场景比如:AI 辅助代码生成场景:辅助代码生成场景:通过手画设计界面、交互逻辑、数据结构等,直接拍照给多模态大模型,即可立即生成所需的代码;AI 辅助健身:辅助健身:用户仅需上传自己训练的视频,或者实时拍摄运动、健身的视频,AI 模型可以立刻对不标准动作纠偏,对正确动作给出激励,令用户快乐运动,寓教于乐;AI 辅助教育:辅助教育:用户仅需拍照习题,AI 模型就会立刻给出解答思路,也可以引导学生逐步解题,并立刻索引到相关大纲知识点,提高学习效率
17、;在上述场景中,将多模态模型部署在边缘计算节点而不是中心云机房有以下必要性:降低延迟:降低延迟:边缘计算可以显著减少数据传输的距离和时间,从而降低响应延迟。这对于实时应用场景,如 AI 辅助健身中的动作纠偏,非常重要。提高带宽效率:提高带宽效率:在边缘处理数据可以减少传输至中心云的数据量,节省带宽,特别是在处理视频和图像等大数据时效果明边缘计算 AI 推理技术场景与挑战 ODCC-2024-04001 8 显。提升可靠性:提升可靠性:边缘计算可以在网络连接不稳定时继续提供服务,因为它减少了对中心云的依赖。实时数据处理:实时数据处理:在边缘设备上处理数据可以实现更快的实时分析和反馈,比如在教育场
18、景中即时解题。降低成本:降低成本:减少长距离数据传输和中心云计算资源的使用,可以降低运营成本。2.2.智能交通与车辆智能智能交通与车辆智能 图2:百度智能云智能驾驶解决方案 边缘 AI 在自动驾驶车辆中的应用可以实现低延迟的环境感知和决策制定。例如,百度智能云的边缘计算节点(BEC)在自动驾驶领域发挥着重要作用,通过提供边缘视频就近接入和处理能力,显著提升了内容上传速度及成功率,同时降低了视频处理及分发的延边缘计算 AI 推理技术场景与挑战 ODCC-2024-04001 9 迟。这种技术的应用,为自动驾驶车辆提供了快速响应的能力,是实现高级别自动驾驶的关键技术之一。BEC 的节点覆盖全国七大
19、区三大运营商,拥有超过 1000+的 CDN 节点,确保了服务的全面性和高效性。选择部署在边缘而不是中心的优势主要体现在以下几个维度:低延迟:低延迟:边缘计算节点将算力下沉到距离客户 10KM 内,提供 20ms 内的超低延迟计算服务,这对于自动驾驶车辆的实时反应至关重要。带宽成本降低带宽成本降低:通过就近收流合流转码等技术,边缘计算节点能够提升链路网络质量,降低核心和骨干网络压力,最高可降低 5 倍带宽成本。全域覆盖全域覆盖:BEC 的节点分布实现了全国七大区三网覆盖,解决了地域分布广泛、网络质量不稳定带来的体验和延时问题。弹性伸缩弹性伸缩:资源可以按需进行弹性伸缩,用户可以根据自己的需求灵
20、活调整资源使用,实现成本效益最大化。此外,边缘计算在自动驾驶领域的应用还包括环境感知的扩展和计算任务的卸载。自动驾驶车辆可以通过边缘节点获得更广阔的环境信息,同时将部分计算任务卸载到边缘节点,以解决车载计算资源不足的问题。这种协同感知和任务卸载技术,是实现高级别自动驾驶的重要途径。边缘计算节点边缘计算节点部署部署 AIAI 模型的场景模型的场景 边缘计算 AI 推理技术场景与挑战 ODCC-2024-04001 10 图 5 中国移动边缘计算全栈平台体系 3.3.特点总结特点总结 实时性和低延迟实时性和低延迟:在诸如自动驾驶、智能监控和 AI 辅助健身等场景中,实时性是至关重要的。边缘计算能够
21、在数据产生的地点近乎实时地处理数据,大幅降低响应时间,满足对低延迟的严格要求。地理分布和近源处理地理分布和近源处理:多模态应用场景常见于分布广泛的设备和传感器中,如智慧城市、智能交通系统等。边缘计算使得数据可以在本地被处理和分析,减少了数据传输至中心云的需要,从而提高了处理速度和效率。带宽和成本效率带宽和成本效率:边缘计算通过在源头处理数据,只将必要的信息发送到云端,可以显著降低带宽需求和相关成本。这对于视频监控和智能制造等数据密集型应用尤为重要。可扩展性和灵活性可扩展性和灵活性:随着需求的变化,边缘计算节点可以灵边缘计算 AI 推理技术场景与挑战 ODCC-2024-04001 11 活部署
22、和调整,使得多模态应用场景能够根据实际需求快速扩展或缩减资源,提供更大的灵活性。自适应和智能优化自适应和智能优化:在交通流量分析、智能医疗设备等应用中,边缘计算可以根据实时数据动态优化和调整策略,提高系统的整体智能性和适应能力。(三)(三)边缘计算节点边缘计算节点与中心云部署与中心云部署 AIAI 模型场景特点对模型场景特点对比比 1.1.模型类型模型类型 中心云凭借其强大的计算能力和存储资源,能够轻松支持数十亿甚至数百亿参数的大型语言模型(LLM)。这些模型在泛场景通用性和复杂推理任务中表现出色,如机器翻译、问答系统、文本生成等。受限于计算资源和存储空间的限制,边缘计算节点更适合部署小参数规
23、模的 AI 模型,特别是经过优化的小参数规模大语言模型。这些模型虽然参数较少,但通过精心设计和训练,仍然能够保持较高的性能和准确性,满足边缘设备的实时性和隐私性要求。2.2.计算效率计算效率 对与中心云而言,集中式的计算和存储资源使得中心云能够高效地进行模型训练和推理。通过分布式计算技术,中心云可以加速模型训练过程,提高计算效率。边缘计算节点的计算效率主要体现在低延时和高实时性上。由边缘计算 AI 推理技术场景与挑战 ODCC-2024-04001 12 于数据在本地或附近进行处理,边缘计算节点能够显著减少数据传输的延迟,提高系统的响应速度。这对于需要即时反馈的应用场景尤为重要。3.3.数据传
24、输数据传输 对于中信云而言,数据需要传输到中心云进行处理,这可能导致传输延迟和带宽消耗。特别是在大规模数据处理和实时性要求较高的应用场景中,数据传输可能成为瓶颈。边缘计算节点通过减少数据传输量来降低传输延迟和带宽消耗。由于数据在本地或附近进行处理,边缘计算节点能够显著降低数据传输的需求,提高系统的整体效率。4.4.应用场景应用场景 中心云能够处理来自多个数据源的海量数据,支持复杂的模型训练和推理过程。它广泛应用于需要高计算能力和大数据处理的场景,如云计算服务、大数据分析、人工智能研发等。边缘计算节点能够快速响应本地请求,减少数据传输延迟和带宽消耗。它广泛应用于需要即时反馈和隐私保护的应用场景,
25、如智能安防、自动驾驶、智能家居等。5.5.总结总结 中心云作为 AI 模型部署的核心平台,提供了强大的计算资源和灵活的服务能力。中心云部署 AI 模型的场景特点在于其强大的计算能力、高效的数据处理能力。这些特点使得中心云成为处理大规边缘计算 AI 推理技术场景与挑战 ODCC-2024-04001 13 模、复杂 AI 任务的理想选择。而边缘计算节点通过将数据处理和分析任务带到数据源的近旁,解决了延迟敏感和带宽限制的挑战。边缘计算节点部署 AI 模型的场景特点在于其低延迟、高可靠性和高带宽成本效率的优势。通过对比两者的特点,我们可以根据不同的需求场景选择更合适的方案:表 1.边缘计算节点与中心
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2024 边缘 计算 AI 推理 技术 场景 挑战
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【宇***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【宇***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。