2024大模型十大趋势手册 走进“机器外脑”时代.pdf
《2024大模型十大趋势手册 走进“机器外脑”时代.pdf》由会员分享,可在线阅读,更多相关《2024大模型十大趋势手册 走进“机器外脑”时代.pdf(52页珍藏版)》请在咨信网上搜索。
1、走进“机器外脑”时代2024大模型十大趋势人工智能正在迅速发展,大模型技术正成为赋能各行各业的关键。从算力底座、智力增强到人机协作,大模型正在重塑人类社会,成为我们可依赖的外脑。10趋势1 算力底座迈向十万卡集群量变,速度和效率双提升28趋势6 游戏环境大模型与游戏共生,打造Agent最佳训练场15趋势2 推理分析LLM带来推理能力跃迁,开启“智力即服务”32趋势7 移动革命端侧模型优化带来应用入口变革18趋势3 创意生成AIGC应用爆发,降低专业创作门槛35趋势8 具身智能人型机器人与大模型共同进化,为外脑提供“躯体”22趋势4 情绪感知LLM赋予机器情感价值,打开人机陪伴市场45创新者预见
2、39趋势9 开源共享开源生态实现降本普惠,推进外脑共享和迭代25趋势5 智能制造大模型提升工业新质生产力42趋势10 人机对齐人机对齐是大模型产品的重要竞争力,也关乎通用人工智能的未来CONTENTS目录序言序言1 走进“机器外脑”时代序言2 “人物-行为-场景”一体化的AI新范式序言3 共创、共建、共享智能美好未来020508编委会司 晓|腾讯副总裁 腾讯研究院院长马利庄|上海交通大学特聘教授 人工智能研究院副院长 吴运声|腾讯云副总裁 腾讯云智能负责人 优图实验室负责人张立军|腾讯公司副总裁、腾讯华东总部总经理 吴永坚|腾讯云副总裁 腾讯云智能产研负责人 腾讯企点研发负责人好 好|腾讯云战
3、略研究院院长顾问主编策划研究团队联合出品徐思彦王亚鑫编写委员汪铖杰王 强杜晓宇马晓芳袁晓辉李瑞龙陈楚仪曹建峰白惠天刘莫闲王 鹏陈玉珑李永露张志忠李嘉麟刘 俊刘 永黄小明戚 蕴朱 洁梁 鹏姚 荪谢 睿陈梦凡张 栋王 枢刘 琼腾讯研究院 上海交通大学腾讯优图实验室 腾讯云智能 腾讯青腾王川南李 侃PREFACE序言PREFACE序言1继ChatGPT开启大语言模型引领的新一轮人工智能革命以来,我们持续见证了人工智能领域技术的加速迭代,在过去的一年里众多公司如Google、Midjourney、Adobe以及Inflection等,都推出了创新的模型和产品,标志着大模型技术的成熟和大规模应用的开始。
4、今年2月,Sora的出现再次震撼了技术界,预示着我们可能很快就会见证更多令人兴奋的技术突破。过去半年,我们以日为单位更新“AI每日动态”,这可以充分反映出来,AI技术的发展日新月异,以日来统计的话也是毫不过分的。在海量GPU和新一代大模型的加持下,人工智能在三个方向上有了实质性的飞跃。第一是推理能力。大语言模型为人工智能带来了所未有的推理能力,极大地扩展了机器的认知边界。这种推理能力的跃迁得益于LLM在理解和生成自然语言方面的巨大进步。它们能够解析复杂的文本,提取关键信息,进行逻辑推理,并生成连贯、有见地的回应。这使得LLM能够处理各种知识密集型任务,如法律分析、市场研究、科学发现等,为个人和
5、企业提供了强大的智能支持。以往人类智力难以企及的科学探索高地,都可以在AI的帮助下实现。例如,英伟达的“地球 2 号”项目,旨在创建地球的数字孪生体。模拟整个地球的运行,以预测其未来变化。通过这样的模拟,可以更好地预防灾难,更深入地理解气候变化的影响,从而更好地适应这些变化。通过这样的模拟,可以更好地预防灾难,更深入地理解气候变化的影响,从而让我们能够更好地适应这些变化。随着更高级的推理智能被开发出来,各行各业都将有机会拥有“机器之心”。AI 将引领新的服务模式,即“智力即服务”(IQaaS),该模式的一个重要特征将是机器的推理能力以在云端的方式、通过大模型提供给用户,“AI数字员工”将进一步
6、成为现实。大模型使机器不再仅仅是执行简单任务的工具,而是成为了人类的“智力外脑”。走进“机器外脑”时代司晓腾讯副总裁 腾讯研究院院长02序言走进“机器外脑”时代第二个方面是创意的生成。AI技术,尤其是AIGC,正迅速成为创意产业的一股颠覆性力量,为创意工作者提供了前所未有的生产力提升。今年2月,Sora的问世不仅是技术界的一次震撼,更是对未来创新潜力的一次大胆展示。AIGC技术通过文生文、文生图、文生视频等多种形式,使得创作、设计、分析等任务变得更加高效和易于实现。Sora和SUNO等现象级产品的出现,标志着AI生成内容的质量和多样性达到了新的高度。它们不仅让普通人能够创作出接近专业水准的音乐
7、和视频作品,而且正在快速改变媒体、影视和音乐行业的生态。这些技术的普及,降低了专业技能训练的门槛,使得创意表达更加通用化。现在,只要有创意想法,人们就可以利用AI这个强大的“创意外脑”,将灵感转化为现实。AI的这种能力,不仅为专业创意工作者提供了强大的辅助工具,也为普通爱好者打开了创作大门,使他们能够轻松实现自己的创意愿景。随着AI技术的不断进步,我们可以预见,创意产业将迎来一个更加多元、开放和创新的新时代。另一个方向属于广义的情感陪伴。Dan模式的全网爆火,不仅展示了AI在情绪理解与表达上的巨大进步,更凸显了其与人类情感交流的无缝对接。GPT4o等高级AI系统的自然交互体验,让人与机器的界限
8、变得模糊,仿佛科幻电影 Her 中的情感故事正在逐步成为现实。AI技术在满足人类情感需求方面展现出巨大潜力,扮演起了人们的“情感外脑”。AI聊天机器人提供的心理咨询服务,以其24/7的不间断陪伴,为需要帮助的人们提供了及时的情绪支持和专业建议。在儿童领域,智能玩具不仅陪伴孩子们成长,更通过情感交互,培养孩子们的情感认知和社交技能。随着情感智能技术的不断成熟,数字生命的议题也日渐升温。一些创新尝试正在探索如何利用数字技术复刻已故亲人,为生者提供缅怀与思念的渠道。尽管这一领域还面临着诸多法律和伦理挑战,但其在情感陪伴方面的应用前景无疑为AI赋予了新的温度和深度。AI不再仅仅是冷冰冰的生产力工具,它
9、正在成为人类情感世界中的一个温暖伙伴。随着技术的不断发展和应用的不断拓展,我们有理由相信,AI将在人类的情感生活中扮演越来越重要的角色,为人们带来更多的陪伴与慰藉。PRE-FACE103序言走进“机器外脑”时代在本报告中,腾讯研究院基于科技行业发展和腾讯自身在AI领域的深耕,提出了10个关键性的趋势,试图理解全世界范围内正在发生的AI巨变。与往年一样,我们从技术、应用、社会三个方面来预测AI给经济社会带来的影响。我们正在进入一个“机器外脑”时代。加速技术为大模型行业的发展提供了算力的保障。随着大模型与人机协作的深入,个体创作的门槛进一步降低,越来越多的个体借助大模型外脑成为“斜杠青年”、“超级
10、生产者”,甚至开启自己的“一人企业”。端侧模型的优化将大幅提升提升移动设备的体验,开启全新的人机交互方式。在工业领域,多模态通用感知技术正在提升生产力,而游戏与大模型的共生关系为Agent训练提供了新的舞台。开源模型的成熟,为技术共享与创新提供了强大的生态支持。最后,人机对齐成为确保大模型安全与治理的核心议题,指引着我们走向一个更加智能、高效和安全的未来。这十大趋势共同勾勒出一个由大模型驱动的新未来。在这个未知和无限可能的时代,我们正在目睹AI如何将创意转化为现实,如何让个性化服务触手可及,以及如何为传统行业注入新的活力。AI让智力资源平权化,意味着无论背景或资源如何,每个人都有机会借助AI外
11、脑实现自己的创意与梦想。这一变革不仅降低了创新的门槛,也为社会各阶层带来了前所未有的机遇。只要你拥有创新的想法并善于利用AI这一强大的外脑,即使在资源有限的情况下,也有可能以低成本创造出令人瞩目的成就。让我们一起走进这个“机器外脑”时代,见证人类能力的再次飞跃。PRE-FACE104序言走进“机器外脑”时代PREFACE序言2人物-行为-场景一体化视觉表达与理解是未来人工智能的重要研究方向。随着生成式人工智能以及通用人工智能大模型技术的发展,赋予了智能体感知理解、任务思考、持续学习的一系列能力,并通过直接的物理交互满足人类的各种需求。因而,在未来智能体可以承担更多的体力劳动和重复性任务,而人类
12、则可以更加专注于创造性和思维类工作。其中,人物-行为-场景一体化视觉表达与理解是具身智能、智能生成等人工智能的核心基础,是链接物理世界的关键,一系列顶尖高校以及公司人员都已经下场研究这一新的AI范式。斯坦福大学李飞飞教授创建的公司就利用类似人类的视觉数据处理方式,使人工智能能够进行高级推理。她曾在温哥华TED演讲中表示,其研究涉及一种可以合理地推断出图像和文字在三维环境中样子的算法,并根据这些预测采取行动,这种算法概念叫做“空间智能”。为了解释这一概念,她展示了一张猫伸出爪子将玻璃杯推向桌子边缘的图片。她表示,在一瞬间,人类大脑可以评估这个玻璃杯的几何形状,三维空间中的位置,它与桌子、猫和所有
13、其他东西的关系,然后预测会发生什么,并采取行动加以阻止。她说:“大自然创造了一个以空间智能为动力的观察和行动的良性循环。”她还补充说,她所在的斯坦福大学实验室正在尝试教计算机“如何在三维世界中行动”,例如,使用大型语言模型让一个机械臂根据口头指令执行开门、做三明治等任务。英伟达CEO黄仁勋此前在多个场合强调了一体化视觉表达的重要性,并预测人形机器人将成为未来主流产品。英伟达近期发布人形机器人通用基础模型Project GR00T,希望能让机器人拥有更聪明的“大脑”。由Project GR00T驱动的机器人能够理解自然语言,并通过观察人类行为来模仿人类动作。“人物-行为-场景”一体化的AI新范式
14、马利庄上海交通大学特聘教授 人工智能研究院副院长05序言“人物-行为-场景”一体化的AI新范式2024年5月,以“大模型具身智能”为主题的松山湖科学会议上,近40位院士专家围绕主题分享最新技术趋势和突破性进展。波士顿咨询公司(BCG)预测,到2030年,智能机器人系统可能给全球经济带来约4万6万亿美元的年增长价值。当前对人物理解的研究依旧是机器视觉的核心,但需要从单纯的人脸识别、动作识别等人物视觉技术逐渐转换为与场景交互的一体化表达范式。例如,高速动态场景中自动驾驶系统无法理解周围环境中人和物的多变行为意图,容易引发严重的交通安全事故;服务机器人无法预测儿童的意图,也成为家庭的安全隐患。其核心
15、问题是人物行为具有多样性和歧义性,同样的行为在不同的场景下具有不同的含义,行为意图的歧义性必须通过时序序列分析才能进一步消除。因此,必须研究时序数据进行人物-行为-场景一体化视觉表达,而这就需要对多模态的数据进行联合分析。图灵奖得主Hinton教授在5月访谈中就表示多模态学习可以使模型更好地理解空间事物,因为仅从语言角度来看很难理解这些空间事物。当让模型成为多模态时,如果让它既能做视觉,又能伸手抓东西,并能拿起物体并翻转它们等等,多模态模型就会更好地理解物体。随着diffusion、视频生成大模型的不断发展,真实物理世界的规则先验将成为未来视觉、人工智能研究重点。相较于ChatGPT、图文大模
16、型等生成式人工智能在低维空间探索世界,Sora等视频生成式人工智能开始初步在三维空间模仿真实世界,并以人更容易接受的视频形式加以展示,这样高精度仿真世界投影的出现,也展示出了算力以及算法的进步。Sora生成的视频令人惊讶更多在于它大颗粒度上符合受众对真实物理世界的观察与体悟,让人感觉如“亲眼所见”。其背后是对相关物理规律,如近大远小、自由落体等进行深度挖掘、数字化后的成果。然而,众多权威学者和业内专家发声强调,Sora在二维视觉信息的传播与时空维度的表现力上虽然独树一帜,但并未达到对真实世界的全貌进行全面刻画和模拟的高度,尚未形成严格意义上的世界模型。但瑕不掩瑜,能够生成看起来像是在三维环境中
17、自然移动和互动的视频,已经可以看作是人工智能“虚拟创世”趋势的关键节点。PRE-FACE206序言“人物-行为-场景”一体化的AI新范式在AIGC发展的时间线上,总体是从单模态到多模态,从小模型到大模型这样的越来越复杂化和智能化的过程。AIGC模型的基本逻辑是从多模态的数据集,通过训练生成的大模型,服务于相应的各类应用任务。数据集包含文本、图像、语音、视频、结构化数据、3D信号等等。大模型通过训练来进行生成式的选择,然后不断的加以扩展。这个生成和扩展是需要大规模数据或知识的积累,就像一个人,行万里路以后具备了丰富经验,脑子里有很多经验与知识。但最后还有一步,还是要有一些专家或公认的权威人士对它
18、做强化训练,通过强化学习等生成合理可用的AI模型。最后一步非常重要,如果纯是AI生成的内容,逻辑上可能会混乱,通过强化学习,提高它的精准度,并加以约束使之符合社会伦理、政策法规等。适应的任务范围包括知识检索、文本生成、音频制作、视频制作、科学研究等等,内容是非常广阔。为适应数智时代数字内容智能化生产趋势,2024年4月17日,国家人力资源社会保障部等九部门就联合发布 加快数字人才培育支撑数字经济发展行动方案(20242026年),旨在通过规划数字人才未来的“成长地图”和培育体系,夯实数字经济高质量发展的“人才底座”,发挥数字人才支撑数字经济的基础性作用。人工智能是新一轮科技革命和产业变革的重要
19、驱动力量。其中,具身智能是场景理解感知、逻辑思考、行动决策三者有机智能融合的机器或系统,是人工智能在物理世界的进一步延伸。当今数智时代,能够以十分之一的成本实现千百倍内容生产速度的AIGC(生成式人工智能),正越来越多地参与到数字内容的创意性生成,AIGC可以说将成为了未来互联网的内容生成基础设施,内容生产需求迈入强需求、视频化、拼创意的螺旋式升级阶段。具身智能、智能生成等人工智能技术的发展既需要一套人物-行为-场景一体化表达范式,同时也需求大规模数据或知识的积累以及专业的强化训练。大规模数据或知识的积累这就隐藏着数据以及训练量的规模法则,微软全球前副总裁姜大昕就认为在肉眼可见的未来,至少还有
20、十万亿和百万亿两个数量级。通过大规模数据以及训练集成了一体化表达范式的人工智能通用模型也可以在AIGC大模型、具身智能等应用中大放异彩,从而让机器能够更多地承担冗余重复的工作,释放更多的时间让人类能够更加享受创造性的工作以及高品质的生活。PRE-FACE207序言“人物-行为-场景”一体化的AI新范式PREFACE序言3过去的几十年,于中国实体产业来说是不平凡的,也是令人尊敬的。他们实现了技术与体验的数次跃迁,站在了信息化、数字化、智能化与开放化的“四化”前沿,并继续深入探索如何充分运用AI大模型、云计算、大数据等数字技术和产品,全方位重塑自身业务流程、商业模式与组织架构,迈进以用户体验为中心
21、、业务快速迭代、健康可持续的新发展阶段。作为千行百业的亲密合作伙伴,腾讯云有幸近距离见证了实体产业数字化、智能化转型道路上的点点滴滴,与每个客户一道深刻体会行业的沧桑巨变,体会数字经济时代对业务上、组织上和思维上的莫大影响。近年来,腾讯云也从数字新基建、数字新连接及场景新服务等维度入手,以长期主义心态,不断夯实云计算、大模型等产品技术能力,发挥触达亿万用户的连接能力,与合作伙伴共建开放、健康、安全的数字生态,助力实体经济高质量发展。过去一年里,我们发布了全链路自研的混元大模型,在国内率先采用混合专家模型(MoE)结构。目前,混元已经在腾讯内部600多个业务和场景中落地测试。例如,腾讯会议就基于
22、混元推出AI小助手,通过简单自然的指令,就可以完成发言提醒、观点总结、会议纪要等能力,大幅度提升会议效率。同时,我们面向ToB企业用户也推出了行业大模型,基于腾讯云TI平台和混元大模型基座,以高浓度的行业数据,加强模型对行业专业知识的理解;结合搜索增强与实时查询能力,提升模型解决产业问题的实时性、准确度、安全性等能力。目前,也已经在金融、医疗、教育、汽车、能源等20多个行业落地。共创、共建、共享智能美好未来吴运声腾讯云副总裁 腾讯云智能负责人 腾讯优图实验室负责人08序言共创、共建、共享智能美好未来我们也看到,还有很多企业非常期待将大模型能力快速应用于生产、销售和服务。这需要模块化的大模型Pa
23、aS工具,大幅降低开发门槛,缩短从模型到应用的距离。因此,围绕文本、图片、视频三种信息主要载体,我们推出了三款PaaS产品,“大模型知识引擎”、“大模型图像创作引擎”和“大模型视频创作引擎”,打造大模型原生工具链,助力企业在知识服务、图像和视频创作上提质提效。从通用模型到行业模型到模型开发工具再到即插即用的模型产品,我们一直以“全自研、高可用、强安全”的产品思路,去助力广大用户提效、去尽可能地降低技术使用门槛、去加速AI模型普惠。而这背后,也离不开腾讯在人工智能、大模型方面的投入与积累:过去五年,腾讯在人工智能领域申请专利超过10000项,居全球互联网行业榜首。腾讯优图实验室拥有1600多项人
24、工智能相关专利,发表顶会论文800多篇,多次在国际权威比赛中创造世界纪录。可以说,人工智能正在迅速发展,大模型技术也正成为赋能各行各业的关键。从算力底座、智力增强到人机协作,大模型正在重塑人类社会,成为我们可依赖的外脑。今天,我也很开心看到2024AI大模型十大趋势走进“机器外脑”时代 白皮书发布,报告中所呈现的内容方向精准且富有前瞻性,深入剖析了大模型发展的可能方向和应用影响。比如,其中有一节谈到多模态AIGC会重塑内容产业生态,我是基本认同的。多模态大模型的技术路线是一条充满创新与突破的道路,它融合了多种模态的数据,如文本、图像、音频等,通过复杂的算法和强大的计算能力,挖掘出数据背后隐藏的
25、模式和规律。这种融合不仅极大地丰富了模型对世界的理解和表达能力,还为解决复杂问题提供了全新的思路和方法。其价值更是不可估量。比如在医疗领域,能够辅助医生进行更精准的诊断;在工业生产中,提升生产效率和质量;在文化创作领域,激发无限的创意灵感。多模态大模型正在成为推动社会进步和发展的强大引擎,为人类创造更美好的未来奠定了坚实的基础。这份报告,既凝聚了腾讯云与各方在AI模型方面的洞察与互动,也引发了更多全新的讨论和大胆的畅想。我们希望,该报告能对正在探索人工智能、大模型发展的从业者们有所启发,也希望广大读者给予我们宝贵的反馈意见,期望后续与更多同行者一道推进科技赋能与产业创新,共创、共建、共享智能美
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2024大模型十大趋势手册 走进“机器外脑”时代 2024 模型 趋势 手册 走进 机器 时代
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【宇***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【宇***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。