生成式AI手机产业白皮书2024.pdf
《生成式AI手机产业白皮书2024.pdf》由会员分享,可在线阅读,更多相关《生成式AI手机产业白皮书2024.pdf(27页珍藏版)》请在咨信网上搜索。
1、1 Counterpoint Technology Market Research 2024 Copyright Counterpoint Research.All rights reserved.May 2024 生成式生成式 AIAI 手机产业手机产业 白皮书白皮书 2 Counterpoint Technology Market Research 2024 本白皮书由 Counterpoint 与联发科技共同发布,其他联合发布者包括阿里云通义千问、百川大模型、虎牙、酷狗、零一万物、OPPO、Soul、腾讯 AI Lab、腾讯混元、vivo(按公司名拼音首字母顺序排列)目目录录 前言.3
2、第一章:智能手机开启生成式 AI 手机时代.4 手机的智能化演进.4 Counterpoint 对生成式 AI 手机的定义.5 端云结合将是生成式 AI 部署的主流模式.7 多模态是实现 AI 智能体愿景的关键.7 端侧部署 AI 大模型的优势.8 第二章:生成式 AI 手机生态系统.10 LLM 现状以及预测.10 阿里云通义大模型.10 百川大模型.11 零一万物 Yi 模型.11 腾讯混元.11 未来两年端侧大模型参数规模将继续增长.12 APP 为基础的用户界面与 AI 智能体将会在未来几年内共存.13 芯片设计公司的生成式 AI 战略.14 手机 OEM 厂商的生成式 AI 战略.1
3、4 OPPO 生成式 AI 战略.15 vivo 生成式 AI 战略.15 开发者生成式 AI 战略.16 虎牙.17 酷狗.17 Soul.18 腾讯 AI Lab.18 第三章:生成式 AI 手机的软硬件科技全景.19 端侧部署 AI 大模型的硬件要求.19 软件生态的需求.21 目前可支持端侧 AI 大模型手机的 SoC 平台.22 第四章:生成式 AI 手机预测.24 结论.26 3 Counterpoint Technology Market Research 2024 前言前言 2022 年 11 月 30 日,ChatGPT 上线,并迅速获得追捧。这场最初由 ChatGPT 引发
4、的生成式 AI 浪潮,让全球消费者惊讶于大语言模型(LLM)所带来的全新人机交互体验的同时,也让产业界充分认识到生成式AI 技术在消费者(C 端)市场的巨大应用潜力。而智能手机,作为当下最重要的个人智能终端,在全球范围内拥有超过 40 亿用户规模,无疑是生成式 AI 技术在 C 端应用成功与否的重中之重。另一方面,智能手机产业在进入 5G 时代后,也需要一场真正意义上的颠覆性革新,为消费者带来更加智能、个性化,同时也更加安全的使用体验,将手机打造成全天候的私人智慧助手和移动生产力工具,从而为智能手机下个十年的发展打下坚实的基础。生成式 AI 技术与智能手机的融合刚好契合这一需求,它将全方位赋能
5、智能手机产业,革新包括硬件、软件,以及相关的移动互联网内容生态的方方面面。生成式 AI 与智能手机的融合既是产业各方的需要,也是 AI 普惠的必由之路,以智能手机为媒介,全球手机用户能够更便捷、更高效地享受生成式 AI 技术发展所带来的福祉。本白皮书提出了生成式 AI 手机的概念,讨论了生成式 AI 手机生态中各个玩家,包括芯片厂商、手机厂商、大模型厂商、开发者的相关 AI 战略,以及围绕生成式 AI 手机的软硬件科技全景,最后是Counterpoint 对生成式 AI 手机发展的预测。4 Counterpoint Technology Market Research 2024 第一章第一章:
6、智能手机智能手机开启开启生成式生成式 AIAI 手机手机时代时代 从 2023 年底至 2024 年一季度,新一代旗舰智能手机陆续发布,越来越多的基于生成式 AI 能力的功能开始出现在这些产品中。无论是手机厂商还是其生态伙伴,在主动拥抱生成式 AI 趋势的同时,也在积极探索各种可能性,着力打造对用户有价值的高频使用场景,而这一探索将贯穿整个2024年。Counterpoint认为 2024 年会是生成式 AI 手机的元年。手机手机的的智能化智能化演演进进 大约在二十多年前,以诺基亚塞班为代表的操作系统,第一次允许用户自行下载 APP,并将其作为入口,访问服务和数字内容,这种模式一直持续到今天。
7、也正是这种变化,使得全球的开发者可以加入到智能手机产业中来,为手机用户提供丰富多样的应用选择,促成了之后移动互联网生态的蓬勃发展,手机也逐渐发展为人们休闲娱乐、通信社交、健康和出行服务、消费购物,以及移动办公的重要载体,早已不可或缺。2007 年,iPhone 的问世颠覆了传统的手机设计理念,物理键盘逐渐被淘汰,触控屏幕成为人机交互的核心。然而随着时间的推移,在一些场景下,触控输入的方式变得越来越低效,常常需要多次的用户干预,才能到达最终的服务界面。在此背景下,出现了包括智能语音助手,手势、眼球追踪在内的新的交互方式,致力于打造更流畅、高效,更加用户友好的交互体验。通过 AI 技术赋能智能手机
8、的尝试最早可以追溯至 2017 年,彼时苹果刚刚发布了首款后置双摄手机iPhone 7 Plus,而安卓阵营也开始在其 SoC 平台中加入独立的 AI 计算单元,用于运行和影像增强相关的深度学习模型。在这之后,AI 技术逐渐被手机厂商用于更多方面,如强化安全、优化续航、提升网络性能等,但计算摄影一直是其最主要的应用领域,直到 LLM 被装进智能手机,手机 AI 应用从中小模型时代跨越至大模型时代。得益于 AI 大模型的赋能,智能手机将迎来新一轮的革新。首先在人机交互层面,有了 LLM 的加持,新的多模态交互将取代传统的、单一的触控屏交互,逐渐实现从图形用户界面 GUI 到语音用户界面 VUI
9、的跨越式转变,用户可以以更直观、更自然的方式与手机沟通。其次,多模态输入和输出能力相结合,可以极大强化智能手机的生产力工具属性:既可以基于多种形式的输入信息,生成用户需要的图表、文本、音乐、图片甚至是视频,也可以对输入的图片、视频进行编辑。最后,随着融合的深入,生成式 AI 技术将在智能手机上孕育出一个甚至多个智能生命体(AI Agent)。智能生命体以用户为中心,不断学习用户的行为习惯,能够智能识别用户意图,适时向用户推荐个性化的内容和服务。Counterpoint 认为智能体将会成为专属于每个用户的应用入口,但预计在很长一段时间里,智能体仍将会和 APP 共存。5 Counterpoint
10、 Technology Market Research 2024 图表图表 1 1:手机智能化演进路线图手机智能化演进路线图 来源:Counterpoint Research CounterpointCounterpoint 对对生成式生成式 AIAI 手机的定手机的定义义 Counterpoint 认为生成式 AI 与智能手机的融合无疑将引发一场深刻的变革。参照过往每一次技术革新,在初期探索阶段,新的功能和特性将首先被赋予算力资源更加充裕的旗舰和次旗舰产品,并迅速成为重要的差异化卖点。而随着时间的推移,生成式 AI 能力将加速下沉,从而能够在全球范围内,惠及更广大的消费者群体。基于上述判断,
11、Counterpoint 提出了生成式 AI 手机的概念,并结合现阶段生成式 AI 应用的现状,以及对生成式 A I 手机未来发展与演进的预判,给出了如下定义:6 Counterpoint Technology Market Research 2024 生成式 AI 手机是利用大规模、预训练的生成式 AI 模型,实现多模态内容生成、情境感知,并具备不断增强的类人能力。生成式 AI 手机开启了智能手机发展的新周期,长远看,智能手机会发展为移动智能体。Counterpoint 认为,生成式 AI 手机需要具备如下必要特征:支持大模型的本地部署,或是通过云端协同的方式执行复杂的生成式 AI 任务。生
12、成式 AI 手机本身具备强大的 AI 算力,无须完全依赖云端服务器。具备多模态能力,即可以处理文本、图像、语音等多种形式的内容输入,以生成各种形式的输出,典型用例如翻译、图像生成和视频生成等。确保流畅、无缝的用户体验,设备能够以自然而直观的交互方式,快速响应用户的请求。拥有实现上述特征的硬件规格,包括但不限于基于领先工艺和先进架构设计的移动计算平台,拥有集成或者独立的神经网络运算单元(如 APU/NPU/TPU),大容量和高带宽的内存,以及稳定和高速的连接,硬件级和系统级的安全防御。图表图表 2 2:Counterpoint Counterpoint 生成式生成式 AIAI 手机定义手机定义
13、来源:Counterpoint Research 2024 年是生成式 AI 手机爆发的元年,在产业链的配合下,头部安卓厂商已经成功实现了 70 亿参数大模型的本地部署。在此基础上,一些基础能力被开放给开发者,其中比较有代表性是:基于 Diffusion 大模型的图片和视频生成(本地用例多为低分辨率,如 480p);基于 LLM 的自然语言处理,包括语音转文本,文本转语音,任务型对话,实时翻译和信息问答等,以及基于 sLLM 模型(轻量型语言模型)的文字校对和文本生成、改写和总结。7 Counterpoint Technology Market Research 2024 端云端云结合将是结合
14、将是生成式生成式 AIAI 部署部署的的主流主流模式模式 相对于手机端有限的计算和存储资源,云端无疑拥有更充足的算力,从而能够支持更大规模的 AI 模型部署和训练,当前一些复杂的生成式 AI 任务主要是通过云侧大模型来实现的。从长远看,Counterpoint认为端云结合会是生成式 AI 在手机端侧部署的主流模式。一方面,在未来几年,本地大模型无论是规模还是效率都将保持增长,这意味着用户可以从本地获得多数基于生成式 AI 的服务,本地大模型还将为需要云端介入的任务提供数据脱敏、压缩等预处理,以保护用户隐私。另一方面,云侧 AI 大模型可以为用户带来更有价值的服务,比如提供更高品质的内容输出,如
15、影视、动画制作等,或是专为云办公场景打造智能协同平台,可以打破物理空间的边界,允许海量人群参与到同一个项目中。总之,要用发展的眼光看待生成式 AI 手机这一新现象,目前展示的生成式 AI 用例只是冰山一角。无论发展到哪个阶段,端云协同在满足产业各方需求的同时,也能最大化利用分布在端云两侧的算力资源。在端侧,移动计算平台的每一次迭代和升级,都意味着手机 AI 算力的大幅突破,相应的,消费者可以期待更加流畅、也更加丰富的生成式 AI 体验。同时,生成式 AI 手机的端侧多模态能力也将获得进一步的强化,Counterpoint 认为,多模态能力,包括多模态输入和输出,是生成式 AI 手机愿景得以实现
16、的关键之一,也是实现多元化交互的基础。多模态是多模态是实现实现 AIAI 智能体智能体愿景的关键愿景的关键 上文中,我们提到多模态能力是实现生成式 AI 手机愿景的关键。在 Counterpoint 的预测里,随着生成式 AI 手机的发展,将带来如下几个维度的革新:首先是交互方式的多元化、直觉化,一方面这要求大模型可以识别、理解不同形式的输入内容,用户可以通过文字输入,也可以是一段语音,一张表格,一张图片,一段视频。另一方面,具备多模态输出能力的大模型将以用户为中心,选择最佳的、最适合当前情境的输出方式。可以说,多模态交互是开启全新交互体验的钥匙。长期以来,语音助手被认为缺乏实用性,但有了多模
17、态 LLM 的加持,语音助手将变得更加智能,它能够更加准确地识别、理解人类的自然语言,不但能够快速理解和响应用户指令,还解锁了语音文本互转、多轮对话等能力,在越来越多的场景下,更自然的语音交互将会成为智能手机输入输出的首选方式。其次,今年年初 Sora 横空出世,其展现出的文生视频能力备受行业关注,成为多模态应用创新的“新高地”。对于智能手机用户来说,短视频无疑是当下最受欢迎的移动互联网应用之一,将会是未来数字内容传播最主要的媒介,对优质、个性化、多样化短视频内容的需求也将会持续增长。因此,短视频制作是生成式 AI 最重要的应用领域之一,具备视频理解能力的生成式 AI 手机可以提供智能视频剪辑
18、、风格转换、文案自动生成、以及生成配音等辅助功能,成为视频创作者的得力助手。受益于手机 AI 算力的不断增长,8 Counterpoint Technology Market Research 2024 在不久的将来,语言视觉模型(LVM)也将实现本地部署。届时,通过文字和语音提示生成、编辑短视频将成为可能,这将大幅提升视频制作效率,进一步促进短视频生态的繁荣。最后是 AI 智能体的成长。多模态大模型可以同时感知不同类型的数据,包括图像、文本和语言,从而为智能体的成长提供更多维度和更加丰富的训练语料。这意味 AI 智慧体可以像人类一样从不同的媒介获取知识,不断提升对复杂现实世界的理解能力。在这
19、个过程中,AI 智能体将习得“听说读写”这些类人的本领。此外,伴随着认知能力的发展,AI 智能体将拥有更加全面的能力。联发科技认为未来的智能体还将具备自主决策能力,包括“计划”、“记忆”和“行动”的能力。计划 具备任务分解和自我反思能力;记忆 短期和长期记忆能力;行动 直接执行或利用工具完成特定任务。在联发科技的设想里,智能体可以学习、记忆手机用户的使用习惯,以及兴趣和偏好,在此基础上协助人处理日常生活(食、衣、住、行)以及工作(计划、执行、报告)事項,使得人可以专注在设定目标和进行决策。以旅行场景为例,智能体可以为在出发前为用户量身订制出行方案,在旅行过程中,可以根据天气、交通和景区信息,以
20、及一些突发情况,动态调整计划,让旅行变得更轻松、更加个性化。端端侧部署侧部署 AIAI 大模型的大模型的优势优势 如前所述,Counterpoint 认为端云结合、优势互补会是生成式 AI 技术与智能手机融合的主流模式。同时,Counterpoint 认可端侧部署 AI 大模型具有如下优势:低延时:在许多生成式AI任务场景下,网络传输时延是用户无法获得流畅体验的主因,而本地大模型可以更快地响应用户需求,将时延控制在秒级甚至是毫秒级别。安全和隐私:AI 大模型本地部署可以确保用户个人数据不离开手机,结合芯片公司提供的基于底层硬件的防护机制,可以最大程度保护用户的数据和隐私安全。减少对网络的依赖:
21、AI 大模型本地部署可以极大降低对网络的依赖,即便是在弱信号,甚至没有网络的情况下,手机仍然可以提供必要的生成式 AI 能力,为用户提供不间断的服务。个性化:具有自学习能力的本地大模型可以成长为每个用户专属的智能体,从而有能力为用户提供个性化的服务和推荐。9 Counterpoint Technology Market Research 2024 减轻基础设施负载:考虑到全球范围内超过 40 亿的智能手机用户,随着生成式 AI 应用在手机上的普及,对AI算力的需求将呈现爆发式增长。通过部署本地大模型,可以在本地完成尽量多的生成式AI任务,一方面降低了对网络带宽占用,另一方面将极大减少手机用户对
22、云计算资源的访问和占用。10 Counterpoint Technology Market Research 2024 第二章:第二章:生成式生成式 AIAI 手机生手机生态系统态系统 LLMLLM 现状以及预测现状以及预测 全球范围内已经掀起了生成式 AI 创新的浪潮,Google 和 Meta 在海外是 LLM 的重要创新者和参与者,其各自 LLM 的战略覆盖了从云侧到边缘,再到端侧的全域场景。2017 年,Google 首次提出了 Transformer 架构,并将其应用于自然语言处理,使其成为最早投入 LLM模型开发的头部互联网企业之一。2022 年 4 月,Google 推出了 LL
23、M PaLM(Pathways Language Model),参数规模达到了 5400 亿。一年后,Google 发布升级版 PaLM2,通过采用 Compute-Optimal Large Model 技术,优化了模型的规模,并强化了多语言、推理和编程能力,从而使 PaLM2 在真实世界中的表现更加优异。2023 年底,随着全新多模态模型 Gemini 的发布,Google 加快了 LLM 的商用化步伐。Counterpoint 判断Google会优先将Gemini用于强化自身业务,如搜索、Chrome浏览器、YouTube等,并尝试赋能安卓生态。Gemini 目前有三个重要版本,分别是面
24、向端侧应用场景的 Gemini Nano(包括 1.8B 的 Nano-1 和 3.25B 的Nano-2),以及面向云侧应用场景的 Gemini Pro 和 Gemini Ultra。2023 年 2 月,Meta 发布自研的基础 LLM LLaMA,包含 70 亿、130 亿、330 亿和 650 亿等四个不同参数规模的版本。同年 7 月,Meta 宣布开源其最新版本 LLaMA2,Meta 还和微软达成协议,后者将在 Azure 和Windows 上支持 LLaMA2。这两项举措帮助 LLaMA2 赢得了众多产业伙伴的支持,开发者可以选择以 LLaMA2为基础,围绕自身业务场景定制开发大
25、模型,极大推动 LLaMA2 的产品化进程。在手机领域,部分手机厂商已经将 Meta 和 Google 作为海外部署生成式 AI 的重要合作伙伴。在 LLaMA2 取得显著成就之后,Meta 于2024 年推出了最新版本 LLaMA3。LLaMA3 在先前版本的基础上进行了多项优化和改进,包括模型参数(7B 到8B)和上下文长度的扩展(4K 到 8K)、算法效率的提升以及更加精细的模型训练。LLaMA3 进一步提升了自然语言处理的准确性和生成能力,将帮助 Meta 巩固其在生成式 AI 模型领域的领导地位,为开发者和产业伙伴提供了更加强大和灵活的工具,以支持他们在各自的业务场景中创造更多的可能
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生成 AI 手机 产业 白皮书 2024
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【宇***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【宇***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。