2024年中国AI Agent行业研究报告.pdf
《2024年中国AI Agent行业研究报告.pdf》由会员分享,可在线阅读,更多相关《2024年中国AI Agent行业研究报告.pdf(60页珍藏版)》请在咨信网上搜索。
1、大模型时代的“APP”,探索新一代人机交互及协作范式出品机构:甲子光年智库智库院长:宋涛撰写分析师:刘瑶、胡博文发布时间:2024.42024中国AI Agent 行业研究报告注:AIGC生成内容亦对本报告有贡献CONTENTS目 录Part 01前世今生:科幻憧憬、学术概念与商业尝试Part 02奇点已至:让每个人掌握AI的力量Part 04时代先驱:当下商业实践值得关注的里程碑Part 05潜力无限:来自于数据、算法、算力的飞轮效应Part 03百家争鸣:属于大模型时代的APP繁荣AI Agent的发展历程梳理:大模型赋予了AI Agent核心改变 Agent(代理)一概念起源于哲学,描述
2、了一种拥有欲望、信念、意图以及采取行动能力的实体。在人工智能领域,这一术语被赋予了一层新的含义:具有自主性、反应性、交互性等特征的智能“代理”。大型语言模型(LLMs)的出现为智能代理的进一步发展带来了希望。基于符号规则基于统计学习基于深度学习基于大模型LLM给AI Agent底层提供了一个突破性技术方案:LLM带来了深度学习新范式,思维链和强大的自然语言理解能力有望让Agent 具备强大的学习能力和迁移能力,从而让创建广泛应用且实用的Agent成为可能LLM的框架优势:过去等强化学习基于深度学习框架可让Agent学到技能,但Agent的泛化性较差,往往用于非常窄的特定领域,例如用在游戏或低维
3、层面的控制或计划,标志性应用是围棋领域的AlphaGo。长期以来,研究者们一直在追求与人类相当、乃至超越人类水平的通用人工智能(Artificial General Artificial General IntelligenceIntelligence,AGIAGI)。在 1950 1950 年代,Alan Turing Alan Turing 就将智能的概念扩展到了人工实体,并提出了著名的图灵测试。这些人工智能实体通常被称为 AgentAgent(代理*)过往的工作主要集中在增强代理的特定能力,如符号推理或对特定任务的掌握(国际象棋、围棋等)。这些研究更加注重算法设计和训练策略,而忽视了模型
4、固有的通用能力的发展,如知识记忆、长期规划、有效泛化和高效互动等。事实证明,增强模型固有能力是推动智能代理进一步发展的关键因素。*Agent 术语的中文译名并未形成共识,有学者将其翻译为智能体、行为体、代理或智能代理,目前行业出现的“代理”和“智能代理”均指代 Agent,后由于2023年Open AI引爆AIGC领域,一般称为AI Agent。过往的AI Agent类型:符号型智能体:采用逻辑规则和符号表示来封装知识和促进推理过程,如1980年前后,出现的医学诊断专家系统,模拟心理治疗程序等;反映型智能体:关注智能体与其环境之间的交互,强调快速和实时响应,缺乏复杂缺乏复杂决策和规划能力;基于
5、强化学习的智体题:关注如何让智能体通过与环境的交互进行学习。基于迁移学习和元学习的智能体:使智能体从少量样本中迅速推理出执行任务的最优策略。AI Agent的发展历程简述数据来源:公开资料,专家访谈,甲子光年智库整理LLM是Agent能力的增效器,交互协作程度是Agent能力的扩展器大模型时代的AI AgentLLM(规划+记忆+工具+行动)提升AI Agent的理解力和泛化能力,使其能更好地处理多种任务和上下文信息。这增强了AI代理的自然语言处理能力,从而提供更个性化、连贯的交互体验。LLM是核心控制器,构建核心能力核心特征AI Agent记忆能力行动能力工具能力规划能力人类用户通过用户接口
6、、命令指示等方式与Agent形成交互,是Agent的监督者、合作者和决策者外界环境Agent所处的环境(可能包括虚拟及物理世界),外界环境可以与Agent形成交互Agents其他Agent,多Agent可以形成协作,结合相关任务结果形成群体智能系统开发者Agent的开发者,对Agent的相关能力,设计Agent的相关组件能力人机交互设计开发感知反馈群体协作架构解析 当下大模型的参数量提升AI Agent的理解力和泛化能力,使其能更好地处理多种任务和上下文信息。这增强了AI代理的自然语言处理能力,从而提供更个性化、连贯的交互体验,是当下Agent的构建关键。Agent基于LLM的组件,和交互两个
7、层面数据来源:公开资料,专家访谈,甲子光年智库整理当下的AI Agent可以看作LLM技术下Prompt工程的进化 AI Agent是Prompt工程的一种升级,Agent的核心在于自主性的增强,可有效完成某一个工作点或工作单元,尽量减少人的干预;评价一个AI Agent的核心逻辑:在流程上的节点上完成了什么程度的自动化。AI AgentChain/FlowModelPromptMulti-AgentPrompt模式是把大模型当做工具来调用:大模型的最初兴起的时候,Prompt工程,把大模型当成一种编程语言来看待。人们通过描述角色技能、任务关键词、任务目标及任务背景,告知大模型需要输出的格式,
8、并调用大模型进行输出。因此在2023年,全球AIGC关注者发展了多种Prompt工程的玩法,如角色扮演、零样本提示和少样本提示,希望将Prompt工程发挥到极致。例如一个澳大利亚少年编写了一个15000个字符的提示词,成功地让他变身为人类的导师,教授各种知识。这种方式就像能直接构建软件一样。Prompt工程的万能公式:角色+角色技能+任务核心关键词+任务目标+任务背景+任务范围+任务解决与否判定+任务限制条件+输出格式/形式+输出量。Agent的核心在于自主性的增强,这种增强的核心要义是可以去独立完成一个工作节点,在某个工作节点几乎可以减少人类的审核。让整个事件的流程在此刻完成闭环成本降到最低
9、(包括时间成本和金钱成本);评价一个Agent的逻辑:在流程上的节点上完成了什么程度的自动化。自主性的增强,自动化完成连续行动数据来源:公开资料,专家访谈,甲子光年智库整理【记忆】和【规划】是学术概念下的关键功能点,商业概念也将逐步落地 从学术概念来看【记忆】和【规划】对于AI Agent学术概念上的完整性非常关键,但受限与市场发展早期,在实际的商业产品落地中【记忆】和【规划】能力未必能完全呈现 理解这点就能接受在当下市场环境下AI Agent产品功能的不完整,并且对Agent的形态持续保持关注和期待。记忆感觉记忆视觉记忆听觉记忆触觉记忆短期记忆长期记忆显式记忆情景记忆(事件经历)语义记忆(事
10、实概念)隐式记忆人类记忆类型AgentAgent映射例子感觉记忆学习原始输入的嵌入表示,包括文本、图像或其他形式,短暂保留感觉印象。看一张图片,然后在图片消失后能够在脑海中回想起它的视觉印象。短期记忆上下文学习(比如直接写入prompt中的信息),处理复杂任务的临时存储空间,受有限的上下文长度限制。在进行心算时记住几个数字,但短期记忆是有限的,只能暂时保持几个项目。长期记忆在查询时Agent可以关注的外部向量存储,具有快速检索和基本无限的存储容量。学会骑自行车后,多年来再次骑起来仍能掌握这项技能,这要归功于长期记忆的持久存储。表:人类记忆与AI Agent记忆的映射图:人类记忆的分类AI Ag
11、ent记忆能力行动能力工具能力规划能力知识图谱搜索引擎代码解释器计算反思任务分解思维链工具使用2024年仅仅距离AIGC全面爆发的2023年才过去1年,受限于算力、模型、数据等等多种因素制约,往往部分Agent产品会难以获得“记忆能力”和“规划能力”;产品的效果往往可以依靠数字化及过往自动化手段完成。数据来源:公开资料,Lilian WengLLM Powered Autonomous Agents,甲子光年智库整理AI Agent市场处于早期阶段,产品及服务模式需要大量的探索 当下的市场状态是AI Agent商业类产品的爆发前夜,市场需要给与AI Agent更多的空间,AI Agent需要进
12、行不断地探索;此时,AI Agent的市场概念与学术概念出现混淆感和分歧,部分Copilot产品在结果上也可作为Agent模式的产品出现。Copilot 与Agent最大的区别在于“自主规划”的能力:Copilot 的模式需要人的指挥;而Agent则是直接面对目标任务,具有自主记忆、推理、规划和执行的全自动能力,因此终极形态的AI Agent只需要用户的起始指令和结果的反馈,过程中并不需要人的介入。人AIAIAI人人绝大多数的工作仍然由人完成指示AI指导AI指挥AI绝大多数的工作可以由AI完成ChatbotCopilotAgent2024是AI Agent的爆发之年,也是产品逐步从Copilo
13、t模式转向AI Agent的探索之年;因此市场中往往也会把自动化程度高的Copilot产品作为泛化的Agent概念产品。Copilot 与Agent的混淆点在于对于“工作流”的“自动化”的区分:从完成效果看,工作可以人为地被无限拆分,部分“Copilot产品+自动化”可以完成单个工作单元的完全自动化。名称自动化的实现方式含义Chatbot/人类完成绝大部分工作,类似向AI询问意见,了解信息,AI提供信息和建议但不直接处理工作Copilot借助复杂的提示词完成自动化人类和AI进行协作,工作量相当。AI根据人类prompt完成工作初稿,人类进行目标设定,修改调整,最后确认Agent通过设定目标完成
14、自动化AI完成绝大部分工作,人类负责设定目标、提供资源和监督结果,AI完成任务拆分,工具选择,进度控制,现目标后自主结束工作数据来源:公开资料,专家访谈,甲子光年智库整理随着AI Agent的能力提升,过往的工作范式可被颠覆 Agent的商业价值围绕工作范式差别展开(面向过程VS面向目标),工作范式的改变则意味着真正的智能时代开启。等级感知能力认知能力执行能力规划能力L1(部分自动化)“所见即所得”的感知,处理单一模态下的相对简单的数据类型,应用于简单场景利用大量人类监督信号获得的一定程度的理解语言、利用语言人机交互能力少量的常见标准工具的调用,简单的工具调用逻辑静态地执行特定的、预定义的任务
15、。涉及少量的、简单串并联的流程节点L2(有条件自动化)多模态感知能力,能处理更广泛的数据类型,应用于更多样、更长尾、更复杂的场景全面的认知能力,包含记忆能力、决策能力、高度智能的对话能力、内容生成能力可使用的工具数量、类型、实现的业务逻辑的复杂度得到极大提升以业务规模达到端到端最大化自动化为目标,可以规划和编排大量流程节点和复杂逻辑L3(高度自动化)综合利用认知能力,环境交互结果,在少量人类干预下获得超高精度的感知力通过综合利用环境知识、人类少量的监督信号,达到高精度的认知水平在人类少量干预下,可以实现绝大多数工具调用代码能够主动洞察问题域和求解域的环境变化,实现业务流程的灵活适应和编排,环境
16、适应能力强L4(完全自动化)在无人工干预下智能体自主进化获得超高精度的感知能力利用环境信号自主学习提升认知水平能自动学习工具使用的方式、实现100%的自动化调用工具的能力能利用过程反思、经验沉淀,难例挖掘等高度智能化的决策机制,自主提升规划和编排能力,自主进化面向目标架构面向过程架构AI Agent的能力增加促进工作范式的转移软件工程思路Agent工程思路人为中心AI为辅助AI为中心人为辅助固定形态的交互界面预定义有限域的任务。信息分发平台海量长尾数据规模化的生产方式动态人机交互界面无预制有限域的任务。知识和世界模型的分发平台海量长尾任务规模化的个性化生产VS数据来源:公开资料,专家访谈,甲子
17、光年智库整理AI Agent不同自动化程度所需要的能力简要分析CONTENTS目 录Part 01前世今生:科幻憧憬、学术概念与商业尝试Part 02奇点已至:让每个人掌握AI的力量Part 04时代先驱:当下商业实践值得关注的里程碑Part 05潜力无限:来自于数据、算法、算力的飞轮效应Part 03百家争鸣:属于大模型时代的APP繁荣AI Agent是每个普通人都可以尝试搭建的AIGC领域个性化应用 如果说大模型是属于工程师的技术游戏,那么AI Agent则是每个普通人都可以尝试的乐高;但同时这也意味着用户的需求并不明确,往往是供给激发需求;用户对产品体验往往要求较高,强调“易用性”;杀手
18、级应用的“Super APP”是面向上亿级别C端用户的大众化应用,用户群体庞大且喜好各异,因此产品本身需要适配大多数用户的使用习惯,包括较低的学习成本、较快的响应速度、合适的使用场景等。生活助手类心理陪伴类休闲娱乐个性化交互健康医护类家庭/个人财务类艺术类旅行类法律类陪伴交互专业顾问生活助手1.日常任务管理2.健康咨询3.生活小贴士4.美食探索5.时间管理信息与教育1.信息查询2.学习辅导3.新闻更新4.个性化内容娱乐与休闲1.娱乐推荐2.教育游戏3.创意激发4.个性化问候5.个性化内容健康与健身1.饮食计划2.锻炼建议商业与财务1.预算规划2.购物建议3.财务管理4.技术支持旅行与探索1.旅
19、行目的地信息2.行程规划3.旅行小贴士创意与艺术1.创意写作灵感2.艺术创作建议数据来源:公开资料,专家访谈,甲子光年智库整理AI Agent 可以实现员工与数字生产力的协作,直接带来企业价值 用户需求明确:只需要帮助企业降本增效,即长期来看提升的产能大于投入的成本(ROI1),就会有望形成付费,指标更容易量化;对产品体验的要求较低,强调“可用性”:面向企业端的定制化应用,客户群体规模较小且需求明确,因此帮助企业效率提升的重要性大于产品本身的使用体验;AI Agent则带来人机协作的价值:企业面对真正意义上的数字化生产力的来临,每个员工都可以有自己的数字助力协作工作,将每个员工的能力最大化的提
20、升。47%42%40%38%25%8%更快地为企业带来价值生成内容和结果的准确性所在领域的经验积累帮助带来可衡量的商业价值供应使用数据的方式更易合作(例如合同、付款协议等)图:企业选择AIGCAIGC项目时的重点考虑因素63%53%49%45%43%31%16%改善客户体验/服务提高开发人员生产力实现差异化竞争优势创新商业模式提高创收能力和订单速度改进绩效决策提高员工生产力图:企业最希望通过AIGCAIGC应用实现的商业利益数据来源:公开资料,专家访谈,甲子光年智库整理AI Agent的商业价值核心因素之一:用工程化的思想提高群体的工作均值 AI Agent可以用工程化思想对抗个体工作的不确定
21、性,过往的SOP、PDCA、OKR等管理方法可以与AI Agent进行适配,完成管理工作的科学升级。1.识别问题2.定义问题3.分析问题4.生成解决方案5.评估方案6.选择方案7.实施方案8.监控和反馈9.总结经验SOPOKRPDCA计划(Plan):在这个阶段,组织需要确定方针和目标,以及制定活动的规划和计划。这包括对现状的分析,找出问题,分析问题产生的原因,以及拟定措施和计划。执行(Do):根据计划阶段制定的方法和方案,进行具体的运作和实施,以实现计划中的内容。检查(Check):在这个阶段,组织需要总结执行计划的结果,明确哪些做法是正确的,哪些是错误的,找出问题,并评估效果。处理(Act
22、):对检查阶段的结果进行处理,对成功的经验和失败的教训进行总结。成功的经验要标准化,而未解决的问题则应提交给下一个PDCA循环中去解决。PDCA广泛应用于质量管理和持续改进的过程中:目的:明确SOP的目的和重要性。范围:描述SOP适用的范围,包括适用的部门、过程或产品。责任:指定负责执行SOP的人员或团队。步骤:详细列出执行任务所需的每个步骤,包括操作顺序和具体要求。SOP(Standard Operating Procedure)是用于指导员工如何执行特定的任务或操作的指导文件:明确目标(Objective):OKR要求团队和个人明确具体的目标,这些目标应该是具有挑战性的,同时清晰、具体,并
23、且能够激励团队成员。量化成果(Key Results):关键结果是衡量目标达成程度的具体指标。它们应该是可量化的,这样团队可以明确地知道何时达成了目标。OKR(Objectives and Key Results)是一种设定和跟踪目标及其执行结果的管理工具和方法:标准:定义执行任务所需遵守的质量标准或性能标准。参考材料:提供执行SOP时可能需要参考的文档或资源。记录:说明需要记录的数据和信息,以及记录的方式。审核和批准:规定SOP的审核和批准流程AI Agent可以是工程化思想的切实工具AI Agent可标准地进行问题的拆解AI Agent可自主地完成单个工作单元反思反馈规划行动数据来源:公开
24、资料,专家访谈,甲子光年智库整理AI Agent实现行业know-how的具象化:个性化+专家级的知识库构建技术窍门:指的是企业在生产过程中掌握的特定技术,这些技术可能未被广泛知晓,是企业保持竞争力的关键。操作技巧:涉及日常操作中的技巧和方法,这些技巧可能来自于员工的个人经验或企业多年的实践。工艺流程:企业在生产过程中形成的特定工艺流程,这些流程可能经过多次优化,以达到提高效率和质量的目的。商业策略:企业在市场竞争中形成的特定商业策略,包括市场定位、产品定价、营销推广等。管理方法:企业在管理过程中形成的有效管理方法,如人力资源管理、财务管理、供应链管理等。市场洞察:企业对市场的深入理解和预测,
25、包括消费者行为、市场趋势、竞争对手分析等。知识产权:虽然知识产权通常被视为正式的知识,但它们也是know-how的一部分,因为它们保护了企业的创新成果,如专利、商标、版权等。企业文化:企业的价值观、行为准则和工作氛围,这些文化因素可以影响员工的行为和企业的决策。客户关系:企业与客户建立的长期关系,包括客户信任、忠诚度和口碑等。企业真正的“专家级知识”藏于大量资料及流程之下公司运营积累的丰富经验、专业知识及行业Know-how对于企业来说非常宝贵,因为它很难被竞争对手复制或购买随着中国企业数字化进程不断发展,部分企业已经积累了大量的数字文档、资料等文档资料财务数据人力资源信息市场资料供应链信息运
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2024年中国AI Agent行业研究报告 2024 年中 AI Agent 行业 研究 报告
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【宇***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【宇***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。