智能家电与生成式人工智能大模型创新与发展白皮书.pdf
《智能家电与生成式人工智能大模型创新与发展白皮书.pdf》由会员分享,可在线阅读,更多相关《智能家电与生成式人工智能大模型创新与发展白皮书.pdf(63页珍藏版)》请在咨信网上搜索。
第 1 页 pOxPxOnNsQpNpRoNmRpOrNbRaOaQpNpPnPsReRqQvNkPpMqR9PmMvMuOpMmMxNoPsQ 序言序言 生成式人工智能(AIGC)的发展和应用已开始显现对社会与经济的深刻影响趋势。在众多行业中智能家电将成为通过 AIGC 最直接赋能的行业之一,推动智能家电行业在新赛道上创新与升级,开辟智能家电行业发展新空间,为消费者提供更智能、便捷、个性化的产品和服务。智能家电产业链的拓展也将带动相关领域的产业发展并创造就业机会。本白皮书聚焦于探讨 AIGC 技术与智能家电结合的机遇与挑战、技术与应用、创新与发展。中国作为信息产业大国,智能家电产业作为我国的优势产业之一,已经建立了较为完善的产业链体系,涵盖了研发、制造、销售和服务等多个环节,为 AIGC技术的应用提供了广阔的应用场景和丰富的数据支持。这种独特的优势将为中国在智能家电与 AIGC 融合的可持续性发展奠定坚实基础,并为中国在国际智能家电市场中赢得竞争优势。中国智能家电产业通过不断创新和技术升级,抓住AIGC契机将不仅满足国内消费者对智能化产品的需求,还将拓展到海外市场。然而,智能家电与 AIGC 融合也面临着数据隐私、安全和伦理等方面的挑战。正如本白皮书所指出的,只有坚持合规性原则,才能保障产业的健康发展。这需要制定和遵守相关法律法规,并加强数据安全管理和技术防护手段,有效确保数据的安全性和隐私保护。此外,通过制定更加完善的标准和规范,以透明和可信赖的机制,加强行业自律机制和监管及审查,为用户提供可信的智能家电产品和服务。白皮书呼吁,在“产业高质量发展”的国家战略的指引下,通过加强产学研合作,建设智能家电行业数据库和行业 AIGC 大模型,以推动人工智能在智能家电领域的创新应用,这不仅有助于智能家电行业的进一步升级,还将对智能家电行业上下游产业链产生积极的影响,提升我国在人工智能领域的全球地位。本白皮书的发表为行业指明了前进的方向,促进产业链的紧密合作,推动智能家电与 AIGC 的融合,以科技创新的力量,为智能时代的到来创造更加璀璨的明天。智能家电与生成式人工智能大模型:创新与发展白皮书 目录 1.引言.1 2.智能家电产业概述.3 2.1 智能家电的定义、市场规模和增长趋势.3 2.2 智能家电系统的软件平台架构.4 2.3 智能家电产品和服务的分类与特点.4 2.4 智能家电产业面临的挑战和机遇.8 3.生成式人工智能大模型简介.10 3.1 生成式人工智能大模型的基本原理和核心技术.10 3.2 生成式人工智能大模型的行业数据库构建.15 3.3 国产生成式人工智能大模型的未来发展趋势.18 3.4 生成式人工智能大模型在行业细分领域的垂直应用前景.19 3.5 引入 AIGC 的优势和局限性、以及潜在的发展方向.20 4.生成式人工智能大模型在智能家电产业中的应用.22 4.1 生成式人工智能大模型在智能家电中的应用案例.22 4.1.1 面向智能客服的 AIGC 应用场景.22 4.1.2 面向家庭场景自生成的 AIGC 应用场景.23 4.1.3 面向家电生产制造的 AIGC 应用场景.24 4.2 家电行业 AIGC 的未来场景展望.25 4.2.1 面向家电整机企业 ToB 垂直应用场景.33 4.2.2 面向家电、家庭、人和健康的 ToC 应用场景.33 5.人工智能时代智能家电产业的合规性应对.36 5.1 智能家电产业中的数据隐私和安全问题.36 5.2 智能家电产业应注意的伦理和法律合规问题.37 5.2.1 国内对于智能家电信息安全约束性法律法规.37 5.2.2 国外对于智能家电信息安全约束性法律法规.39 5.2.3 智能家电应用生成式人工智能技术可能面临的伦理问题.41 智能家电与生成式人工智能大模型:创新与发展白皮书 5.3 国内外行业标准和应对策略.42 5.3.1 国内智能家电信息安全相关标准.42 5.3.2 国外智能家电信息安全相关标准.45 5.3.3 加强人工智能标准化工作.47 6.未来发展趋势和前景.51 6.1 提升智能模型的能力.51 6.2 支撑智能家电产品和服务的创新与变革.52 6.3 开放平台与生态合作.55 6.4 数据算法安全和伦理规范.58 参考文献.59 智能家电与生成式人工智能大模型:创新与发展白皮书 第 1 页1.引言引言 2022 年底,ChatGPT 的出现,在短短 2 个月内就吸引了上亿用户,成为历史上增长最快的应用程序。同时,大模型技术也迅速在全球范围内蓬勃发展,通用大模型和产业大模型层出不穷。大模型中的训练参数数量从几十亿迅速增加到几万亿,并以惊人的速度持续发展,引起各国广泛关注。人工智能强国如美国、中国、欧盟等纷纷发布政策,旨在规范人工智能的健康发展。近年来,中国得益于互联网和创新政策,人工智能取得了巨大进步,但整体上仍处于发展初期。中国工程院院士高文曾指出,全球通用的 50 亿大模型数据训练集里,中文语料仅占 1.3%。在数据方面,中国迫切需要有头部企业牵头,建立起大模型的中文语料库和行业语料库,构建面向垂直领域的国产 AIGC 行业大模型开放平台,并赋能到周边产业。人工智能的核心要素包括数据、算法、算力。大规模预训练模型,需要积累海量的数据,具备出色的算法解决能力,并投入大量的算力进行模型训练。国产通用大模型领域竞争激烈,AIGC 在垂直领域的应用主要以拼接式生成为主导,尚未构成核心场景。这意味着垂直领域仍然是 AIGC 技术的主要发展方向。中国在垂直领域拥有更多的数据来源和用户需求,可以为大模型的训练提供更多支持和指导。因此,中国应该尽快在具备优势的产业等垂直领域切入行业大模型。本白皮书强调,中国需要集中资源和人才,在垂直领域加速推进大模型技术的研究和应用。由国家级创新中心主导,通过与行业合作伙伴共同建立行业大模型平台,推动人工智能技术在不同领域的落地和应用。智能家电产业作为中国的优势产业,在建立行业数据库和国产 AIGC 大模型方面具备了技术基础和市场需求。根据 GfK 中国测算 2022 年数据显示,中国智能家电市场近六年零售额年增长率达到 8.1%,领涨整体家电市场。2022 年,中国的智能家电渗透率达到 50%,远高于全球的平均水平 37%。这些数据表明,在中国制造和创新的推动下,智能家电市场迅速发展并取得了显著成果。中国智能家电产品在技术水平和市场占有率方面处于全球前列。同时,智能家电产业的智能家电与生成式人工智能大模型:创新与发展白皮书 第 2 页 发展还辐射带动智慧家居、智慧家庭、智慧社区、智慧城市等多个相关产业。因此,建设智能家电行业数据库和国产 AIGC 大模型不仅能赋能本行业,还能对周边产业产生积极影响。为了促进智能家电产业 AIGC 的健康发展,国家高端智能化家用电器创新中心联合产学研上下游机构和厂商等单位,发布以“建设面向智能家电产业的国产大模型开放平台”为目的的白皮书。通过智能家电通用大模型平台的构建,规范家电产业行业数据积累,加速大模型底层技术的发展,并探索国产 AIGC 助力智能家电进入 3.0 时代的有效路径,同时构建家电产业领域 ToB 端和 ToC 端垂直应用场景。本报告共分为六个章节,之后的章节安排如下:第二章介绍智能家电产业的概况,阐述智能家电产品和服务的分类与特点、产业面临的挑战与机遇。第三章梳理生成式人工智能大模型的基本原理和核心技术,介绍国产生成式人工智能大模型的未来发展趋势,以及在行业细分领域的垂直应用前景。第四章介绍生成式人工智能大模型在家电产业的应用案例以及未来场景展望。第五章探讨人工智能时代智能家电产业面临的数据隐私和安全问题、伦理和法律合规问题,给出智能家电产业的合规性应对措施和建议。第六章从提升智能模型的能力、预测智能家电产品和服务的创新与变革、开放平台与生态合作等方面阐述智能家电产业与AIGC 融合的未来发展趋势和前景。智能家电与生成式人工智能大模型:创新与发展白皮书 第 3 页2.智能家电产业概述智能家电产业概述 2.1 智能家电的定义、市场规模和增长趋势智能家电的定义、市场规模和增长趋势 随着人工智能技术和物联网技术的不断发展,智能家电产业正逐渐崛起,旨在提升家居生活的便利性和舒适度,为用户带来更智能、绿色、健康的生活方式。近年来,中国智能家电市场呈现出快速增长的势头,随着智能家电逐步普及和消费者对其认知度的提高,智能家电产业迎来了更广阔的发展空间。展望未来,智能家电产业将继续朝着智能化、集成化、标准化的方向发展。它将推动智慧家庭和智慧城市建设,为人们打造更加便捷、舒适、智能的生活环境,打造一个智慧、互动、可持续发展的生态系统。智能家电是将微处理器、传感器技术和网络通信技术融合到家电设备中,通过物联网、人工智能、大数据等先进技术的运用,将传统家电升级为智能化、自动化、互联化的新型产品。这些智能家电具备自动感知住宅空间和自身状态的能力,在提供服务的同时,也能接收和执行来自住宅内外用户的控制指令。作为智能家居系统的重要组成部分,智能家电能与其它家电及家居相互连接,形成高度集成的智能家居生态系统。用户可通过手机 App、语音控制、智能遥控等方式实现远程控制和智能操作,以实现整个智能家居系统的功能。这种智能化的操作方式极大地提高了家居生活的便捷性和舒适度,使人们在享受现代科技带来的便利的同时,也能更加轻松地掌控家庭生活。根据观研报告网发布的 中国智能家电行业现状深度研究与末来前景分析报告(2023-2030 年),2020 年我国智能家电市场规模达到 1907.4 亿元。2021 年我国智能家居市场规模维持增长态势,达 2131.2 亿元,增速为 11.7%。整体而言,我国智能家电行业己从单品智能化发展阶段步入家电系统智能化阶段,智能家电的智能水平持续提升。此外,2022 年政府工作报告提出了鼓励地方开展绿色智能家电下乡和以旧换新的政策措施。这将刺激乡镇农村地区的消费意愿,提升智能家电在下沉市场的渗透率,有助于进一步扩大市场规模。预计到 2025 年,我国智能家电市场规模将达到 3119.5 亿元。总体来看,智能家电行业在我国市智能家电与生成式人工智能大模型:创新与发展白皮书 第 4 页 场有着巨大的发展潜力。随着技术的不断进步和政策的支持,智能家电的普及和应用将进一步提升。未来,智能家电将成为家庭生活的重要组成部分,为用户提供更智能化、便捷化的生活体验。图 1:智能家电市场规模以及增速 2.2 智能家电系统的软件平台架构智能家电系统的软件平台架构 智能家电系统需要多层次的软硬件架构模式用以支撑不同的智能化发展阶段,主要分为单机智能、协作智能、决策智能、高阶智能以及泛在智能的 5 个演进阶段。智能家电系统架构的演进体现为从单体设备到系统化智能,逐步增强联动、决策和自主学习能力,最终实现全场景的泛在智能。在不同发展阶段中,该架构在系统特征和功能层面呈现出明显的变化,从而实现了不同的智能化水平。单机智能阶段的系统特征是侧重于单一设备的控制和基本功能。家电独立运作,智能功能局限于单体设备。用户通过云端服务器实现远程操控,设备孤立、互动有限。在这个阶段,系统软件的主要作用是提供操作系统和应用层,以实现设备的基本控制和用户交互。协作智能阶段强调各智能家电间的融合协作,通过中心云或边缘计算实现联动。互通性增强,不同品类/品牌的智能设备能够互联互通,构建智能家电系统的应用场景。在这个阶段,系统软件的架构引入了服务框架层,该层支持不同设备、异构协议之间的互通,从而实现了设备之间的联动协作。同智能家电与生成式人工智能大模型:创新与发展白皮书 第 5 页 时,多模态人机交互开始出现,指令式的语音交互,大/小屏端的设备操控及信息呈现,指纹、人脸的身份识别等 AI 算法广泛应用在不同品类的智能设备上,一定程度的改善了用户使用智能家电系统的体验。决策智能阶段的特点在于设备能够具备一定的智能决策能力,可以根据数据做出优化决策。系统软件在这个阶段进一步加强了服务框架层,引入了大模型来进行智能决策,应用层也得以提供更加智能化的预测和自动化服务。大模型应用推动系统智能升级,实现主动学习和预测用户需求,为智能化水平的跃迁提供了关键技术突破路径。系统拥有自主决策能力,提供智能推荐和自动化管理。高度主动智能阶段所具备的特征是设备拥有更高级的主动性和个性化服务。通用人工智能技术进一步发展应用,家电向人类智能水平靠拢。实现智能决策、交互和个性化服务,用户体验更加智能化。在这个阶段,系统软件在服务框架层方面的功能进一步加强,以支持智能交互。应用层也会提供更个性化的推荐和自主决策服务,满足用户的个性化需求。泛在智能阶段的系统特征在于智能设备无处不在,实现了真正的泛在智能。跨设备、场景、地域实现全方位智能融合,智能技术嵌入各种设备和环境,实现无缝智能交互,提供全场景、泛在智慧生活。为实现这一目标,系统软件在连接和服务框架层方面进一步加强,实现智能算法的自我学习和进化。应用层则能够实现全场景的智能交互,让技术更加透明地融入人们的生活。图 2:应用大模型的智能家电系统架构图 总体来看,智能家电系统架构经历了演进,从单体设备到全面智能化,不断智能家电与生成式人工智能大模型:创新与发展白皮书 第 6 页 增强联动、决策和学习能力。随着通用人工智能技术发展,智能家电将实现更高水平的自主智能和泛在智慧生活,构建智慧、便捷、智能的家居生态。在不同阶段,软硬件架构分层解耦,从硬件平台到应用层,逐步完善智能能力。不同的系统特征指导下,软件系统不断拓展和优化各个层次,从而使得智能家电在功能、智能化和用户体验方面得到了持续提升。关于智能家电系统架构演进的论述,将在该白皮书的姊妹篇 面向未来的智能家电基础软件发展白皮书 给出详细介绍。2.3 智能家电系统和服务的分类与特点智能家电系统和服务的分类与特点 在设计智能家电系统和服务协议时,需要综合考虑智能家电系统的能力需求、产品和服务特性以及所面临的挑战。智能家电系统和服务可以分为四个主要类别:安全系统、能源管理和电气控制系统、监测系统以及居民便利应用。(1)安全系统:主要用于监视房屋并检测是否有不受欢迎的入侵者。智能家电产品如智能监控摄像头、智能门锁、智能报警器等,为用户提供实时的监控和警报功能,提高家居的安全性。(2)能源管理和电气控制系统:该系统主要提供四个主要功能,包括家庭管理、真实的监测和控制、能量分析和能量优化。如智能照明、智能空调、智能烤箱等。在不影响居民舒适度的前提下,以经济便捷的方式优化能源消耗。(3)监测(健康/老人/儿童)系统:主要用于早期阶段疾病检测、辅助老年人或残疾人长期独立生活等用途,如智能运动手环、智能体重秤等,可以收集和分析用户的身体健康数据。(4)居民便利应用:主要用于增加用户的舒适度并提供一些娱乐服务。如智能电视、智能音响等,支持语音控制、在线内容流媒体播放等功能,以提供高品质的娱乐体验。智能家电系统和服务的特点主要包括以下几个方面:(1)连接性:通过无线网络(如 Wi-Fi、蓝牙等)或有线网络连接,智能家电可以与互联网、用户和其他设备实现互动。这种连接性使得用户可以通过智能手机、平板电脑等移动设备远程控制家电,并获取实时的信息和反馈。此智能家电与生成式人工智能大模型:创新与发展白皮书 第 7 页 外,智能家电还可以与其他智能设备进行互联,形成一个智能家居系统,提供更全面的家庭管理服务。(2)智能化:智能家电采用人工智能技术,例如机器学习和数据分析,使其具备自主学习和适应用户行为和需求的能力。这意味着智能家电可以根据用户的使用习惯自动调整设置、提供个性化的服务,并根据环境和情况做出智能决策。例如,智能冰箱可以根据存储食物的种类和数量,自动生成购物清单或推荐菜谱。(3)自动化:智能家电具有自动化的功能,可以执行预设任务或根据环境和情况自动调整其操作。这提高了设备的效率,减少了用户的参与度。例如,智慧空调可以根据室内温度和湿度自动调节运行模式,以提供舒适的环境;智慧洗衣机可以根据衣物类型和脏污程度自动选择洗涤程序和洗涤时间。(4)用户友好:智能家电提供直观易操作的用户界面,以及多种交互方式,如语音控制、手机控制等,提升用户体验。用户可以通过简单的指令或触摸屏幕来控制家电的开关、调节参数等操作,而无需繁琐的操作步骤。此外,一些高端智能家电还支持自然语言处理和图像识别等先进技术,进一步提升用户体验。(5)个性化:智能家电能够根据每个用户的具体需求和喜好进行个性化设置和服务。通过收集用户的偏好和行为数据,智能家电可以了解用户的生活习惯和喜好,并据此提供相应的定制化服务。例如,智能电视可以根据用户的收视习惯推荐相关的视频内容或应用。(6)兼容性:智能家电可以与各种品牌和类型的其他智能设备协同工作,形成一个互联的智能家庭系统。不同的智能设备之间可以通过统一的标准进行通信和协作,实现数据的共享和信息的流通。这为用户提供了更大的灵活性和便利性,可以根据自己的需求选择不同品牌的智能设备进行组合搭配。(7)数据驱动:智能家电通过收集和使用大量数据来优化性能、提供更好的服务。这些数据包括用户的使用习惯、设备的运行状态、环境的变化等多方面的信息。通过对这些数据的分析和挖掘,智能家电可以预测用户的需求、提高设备的效率、优化能源利用等。智能家电与生成式人工智能大模型:创新与发展白皮书 第 8 页 人工智能技术将推进智能家电产业走向无感化。随着人工智能与物联网(AIOT)新技术全面融入空间智能化,5G+AIOT 赋能智能家电产品革新,智能家居 3.0 模式将实现智能产品的智慧互联。目前,智能家居的入口和控制主要依赖于中控屏和音箱等设备。然而,随着 ChatGPT 等概念应用于智慧家居生活场景领域,人们对算法的自然语言处理能力有了新的认知,也为智能家电和智能家居未来的发展提供了更多想象空间。未来 AIGC 将赋能智能家居场景的无感化,从命令式交互转变为理解式交互,实现人机共创,形成数字管家,实现智能家居由“智能”向“智慧”转化。2.4 智能家电产业面临的挑战和机遇智能家电产业面临的挑战和机遇 在行业自身发展与市场需求不断增加的双重作用下,我国智能家电行业正进入新一轮的发展周期。国内智能家电行业的发展程度与全球智能发展水平全面接轨,在我国正式进入快速发展通道。然而,智能家电产业的高研发成本仍然是制约我国产业发展的主要因素。AIGC 技术成为推动智能家电与智慧家居产业发展内核。即便 OpenAI 公司也面临着 AIGC 算法开发成本居高不下,巨大的运行成本难以盈利的窘境。根据财富杂志的报道,2022 年 OpenAI 的收入为 3000万美元,但净亏损预计为 5.445 亿美元。近日,Analytics India Magazine 发布了一份报告,OpenAI 人工智能服务 ChatGPT 正面临财务挑战,距离实现 2024 年底 10 亿美元收入的目标依然遥远。公司 CEO 阿尔特曼在推特上回答马斯克的问题时表示,在用户与 ChatGPT 的每次交互中,OpenAI 花费的计算成本为“个位数美分”,每月的计算成本可达数百万美元。大模型高昂的训练成本让普通创业公司难以为继,因此参与者主要是科技巨头,国产大模型的训练,至少需要投入超过 1000PetaFlop/s-day 的计算资源。另一方面,智能家居产业链的上游领域,包括芯片、传感器、通讯设备、电容设备、智能控制器等,芯片是智能家居发展不可或缺的关键环节。然而,美国政府对高端 GPGPU 芯片的封锁以及对中国超算的多次限制,给智能家电领域行业大模型的研发带来了巨大的挑战。目前,国产 GPU 产品与国外产品在计算性能方面仍或有一代以上的差距,而在软件和生态层面与英伟达 CUDA 生态的差智能家电与生成式人工智能大模型:创新与发展白皮书 第 9 页 距则更为明显。但国内厂商正奋起直追,致力于实现 GPU 国产化的自主研发突破。其中包括龙芯中科、海光信息、壁韧科技、寒武纪、天数智芯等厂商正在研发或推出用于 AI 计算的 GPGPU、ASIC 等 AI 芯片,有望实现高端芯片的国产化替代。长久来看,美国对中国高端 GPU 的禁售令反而给国产 GPGPU 和 AI 芯片厂商带来快速发展的机会。国产 CPU、GPU、AI 芯片厂商将受益于庞大的国内市场,AI 芯片的国产化比例将显著提高,借此进行产品升级,逐渐达到国际先进水平,突破封锁,实现自主创新并构建自主生态体系,从而降低通用大模型与产业大模型的研发与访问成本,加快推进产业级生成式人工智能大模型的落地应用。生成式人工智能赋能产业的关键因素是高质量行业数据的累积。家电领域的客户需求具有个性化特征,用户激活率低、前端数据采集困难等因素造成了家电领域的数据积累碎片化。因此,智能家电行业的数据特征提取不能具象化,从而制约了生成式人工智能在家庭场景的落地应用。AIGC 技术向智能家居场景进一步扩展过程中,智能家居本身的数据与其他领域的数据互通互联、数据的隐私与安全问题也成为制约行业快速发展的瓶颈。从智能家电硬件基础来看,传统智能家居扩展产生的智能硬件的变革和创新创造出物理意义的家居管家。然而,每一个智能家电设备成为进入家庭网络的潜在入口,从而增加了网络攻击的风险。从安全角度来看,AIGC 的不确定性,应用到智能家居的物理世界交互,极有可能产生的系统安全问题。除此之外,当前智能家电产业的发展还面临着不同厂商设备间技术标准与通信协议的兼容性、节能减排、消费者个性化需求与扩大市场需求等挑战。国际上,智能家电领域多种 IoT 技术和众多生态系统并存,互相竞争,彼此之间不能互联互通。为了解决这一问题,亚马逊、苹果、谷歌等主流生态厂商联合 CSA 于 2022年 10 月 4 日正式发布了 Matter 1.0 标准,旨在将繁杂的智能家居设备收归到统一的通信标准。一时间,智能家居厂商纷纷积极拥抱新标准:硬件方面,Silicon Lab 推出了具备高性能 2.4 GHz RF、低电流消耗和最大内存和闪存容量等设计优势的 MG24 芯片;平台方面,涂鸦智能可以为用户提供“Matter 交钥匙方案”,组建了高价值生态,聚合芯片厂商、认证测试实验室,为客户提供包括制造资源、智能家电与生成式人工智能大模型:创新与发展白皮书 第 10 页认证服务以及客户产品售前、售中、售后的全链路技术支持;产品方面,欧瑞博发布了3款全球首批通过Matter标准认证的智能家居产品SOPRO智能壁灯、MixDimmer 调节装置以及智能开关。显然,Matter 已经成为推倒传统智能家居柏林墙的重要力量。综上所述,国内智能家电行业未来需要加强协同创新,推动产业链上下游企业的深度融合,制定统一的技术标准和规范,加强隐私保护和算法合规性应对。因此,受研发成本、数据资源、系统安全、行业标准等多方面因素的制约,智能家电领域的行业大模型的研发将依托于国家级创新中心所带动的行业联盟共同推进。通过联合众多头部企业的合作,实现行业数据要素汇聚,开展面向智能家电产业的通用大模型的研发,赋能智能家电领域,引领家电行业智慧升级。3.生成式人工智能大模型简介生成式人工智能大模型简介 3.1 生成式人工智能大模型的基本原理和核心技术生成式人工智能大模型的基本原理和核心技术 GPT 大语言模型是一个大规模的人工智能语言模型,通过互联网上大量文本语料进行训练,能通过对话形式和人类进行交互、回答各种问题。其背后的主要技术原理是自监督学习(Self-supervised Learning)、指令微调(Instruct-tuning)和人类反馈强化学习 RLHF(Reinforcement Learning from Human Feedback)。其中 ChatGPT 利用强化学习的方法来与人类意图对齐,利用人类反馈信号直接优化语言模型。智能家电与生成式人工智能大模型:创新与发展白皮书 第 11 页 图 3:GPT 大语言模型主要技术原理 在生成式人工智能大模型的构建方面,预训练和微调是两个主要步骤。首先,采用自监督的学习范式预训练模型。通过超大规模的数据,让模型学习语法以及一些推理能力。然后,在更微观的数据集上“微调”这些模型,这些数据集遵循研究人员提供的指南,由人工审阅者仔细生成。由于无法预测未来用户对系统的所有可能输入,因此不会为模型将遇到的每个输入编写详细说明。相反,在指南中概述了几个类别,使用过程中,模型会根据使用人员的反馈进行概括,以响应给定用户提供的各种特定输入。生成式人工智能大模型的构建基础是数据。大语言模型的训练需要大规模的文本数据集,数据集的规模和质量决定了模型的效果和泛化能力。此外,为了适应不同的任务和应用场景,还需要针对各个场景纳入不同主题、风格、形式的数据,包括图像、语音和视频数据。然后,对原始数据进行清洗和预处理。该过程包括去除无效信息、如噪声、错误、重复或与任务无关的内容。通过清洗和预处理数据,可以提高数据的准确性和一致性,并减少对模型训练的干扰。该过程在生成式人工智能大模型的构建中起着至关重要的作用。在具体的方法学上,模型架构设计是构建生成式人工智能大模型的核心,该设计直接影响模型的效果和性能。生成式人工智能大模型主要通过 Transformer智能家电与生成式人工智能大模型:创新与发展白皮书 第 12 页架构进行迁移学习(Transfer Learning)实现,其主要原理是将从一项任务中学习到的“知识”应用于另一项任务。Transformer 的主要特点是使用自注意力机制或注意力机制的策略,用以计算输入数据中不同部分之间的内在关联,以此理解数据的复杂模式。Transformer 的基本结构由两部分组成:编码器(Encoder)和解码器(Decoder)。编码器将输入序列的输入转化为一系列向量,解码器则将这些向量转化为输出序列。在这个过程中,模型通过自注意力机制来分配注意力到输入序列的不同位置。自注意力机制使得 Transformer 可以同时处理序列中的所有元素,并且能够跨越元素之间的距离进行全局的信息整合。与传统的循环神经网络(RNN)模型相比,Transformer 具有显著优势。它能更好地处理长距离依赖问题,在大规模并行计算设备(如 GPU)上表现更佳,从而大大提高了训练效率。目前,诸如 BERT、GPT 等高级自然语言处理模型都采用了 Transformer 结构。智能家电与生成式人工智能大模型:创新与发展白皮书 第 13 页 图 4:Google 与 OpenAI 在 LLM 领域的发展时间线 图 4 可以看出,GPT 基于的 AI 模型和技术几乎都源于 Google,OpenAI 只智能家电与生成式人工智能大模型:创新与发展白皮书 第 14 页是面向应用做了局部的改进,但结局却是 Google 参考 ChatGPT 匆忙推出自己的大语言模型,这和 OpenAI“实用至上”的价值观和工程思维密切相关。此外Meta 采用开源开放的发展策略,推出了一系列开源的 LLAMA 模型,复现ChatGPT 的效果,而且支持商用,对于生成式大模型推广起到了推动作用。对于ChatGPT 技术路线的拆解追溯,其关键能力来自几个方面:强大的基座模型能力(Instruct GPT),高质量的真实数据,以及从用户标注中反馈学习(RLHF)等。因此,以模型能力为基础,应用为目标导向,构建家电行业的高质量数据库,进而催生“智能家电+大模型”新业态是一种有效途径。在具体的技术实现路径上,生成式大模型通过引入更多的用户指导,在原有的大模型基础上进行微调和强化学习训练,让模型能更好地按照用户意图生成目标内容。其基础原理如下:图 5:大模型微调和强化学习 训练过程可以分成三个步骤:Step1 有监督训练(有监督训练(SFT):收集经过标注的数据,并将其提供给训练有素的标注人员。这些标注人员根据预定的 prompt,对数据进行标注。在这一阶段,智能家电与生成式人工智能大模型:创新与发展白皮书 第 15 页利用已经标注好的数据样本,模型通过有监督的方式进行训练。Step2 激励模型训练(激励模型训练(RM):在有监督训练的基础上,进行激励模型的训练。在这个阶段,目标是最大化较好样本的激励分数。激励分数可以由人工评估或其他指标来衡量,以确定模型生成结果的质量和合理性。通过训练,模型将逐渐调整自己的生成策略,以提升生成内容的准确性和可控性。Step3 强化模型训练(强化模型训练(RL):在激励模型训练后,可以使用强化学习训练的方法进一步改进模型。强化学习是一种迭代的训练方法,在此过程中,模型使用之前生成的输出作为伪标签,重新进行训练。通过不断迭代和反馈,模型可以自我调整和改善,提高生成结果的质量。大模型本质上采用多任务联合学习的方法,并用 zero-shot,one-shot,few-shot等技术取代传统的模型微调方法,以实现下游任务的迁移。通过这种方式,大模型可以实现自主学习和推理的效果预期。然而,要实现这一目标,大模型需要解决几个关键挑战。首先,它需要大量高质量的数据来有效地学习和预测多样化且复杂情况的任务。这意味着必须积累充分的数据集,以覆盖广泛的领域和应用场景。其次,大模型需要强大的算力支持才能确保训练的效率和速度,并在有限的时间内完成更多的训练迭代。只有具备丰富的算法研发经验、积累了大量数据并拥有强大计算能力的企业,才能成功地开展大模型的研发与应用。此外,国家层面的政策支持也将对大模型领域的发展起到关键作用。通过政府制定相关政策、提供资金支持和鼓励技术创新,可以促进大模型的研究和应用,并推动该领域的快速发展。3.2 生成式人工智能大模型的行业数据库构建生成式人工智能大模型的行业数据库构建 建立基于工业互联网的家电行业数据库,训练出用于产业分析的大模型,需要进行以下工作:(1)数据收集与整合:收集来自工业互联网的大量家电产品和用户行为数据,包括但不限于产品规格、性能数据、销售数据、用户评价、使用情况等。这些数据可以通过各种方式获取,如厂商的开放 API、合作伙伴数据分享、本地传感器等,并将其存储在统一的数据库中。智能家电与生成式人工智能大模型:创新与发展白皮书 第 16 页(2)数据清洗与预处理:将收集的数据进行清洗和预处理,例如消除噪音、处理缺失值、标准化不同格式的数据等,以便于后续模型使用。(3)模型设计与训练:基于收集和清洗的数据,设计并训练人工智能大模型。依据具体任务,模型可能包含 NLP、图像识别、预测分析、推荐系统等多个模块。对模型进行训练至使其能够从数据中学习并进行准确的预测或生成。(4)产业分析功能实现:结合具有预测性和洞察力的图表、报告等形象表达形式,对生成的分析结果进行视觉化展示,以便于业界人士进行产业分析。(5)持续优化:收集更多的数据,并且定期对模型进行评估和调整,以适应行业的发展和变化,保证模型准确性和实用性。从家电行业智能生产应用的角度出发,以面向物理对象的方式构建数据表单,添加元数据库和数据治理系统,最终生成一个物理信息数字孪生对象库。图 6:家电行业数据群 面向工业互联大环境,整合家电企业的物理信息系统,可实现产品从设计到维护全过程的智能化,实现生产过程可计算化和可视化,形成从行情、技术、工智能家电与生成式人工智能大模型:创新与发展白皮书 第 17 页艺、利润等分析到控制再到分析的闭合回路,预测在产品制造过程中出现的问题,对生产策略进行分析,然后基于优化后的生产策略实施生产。(1)人员知识库 人员基本信息与专业技能等信息描述以及工作状态等实时参数。(2)设备知识库 设备物理参数、功能参数、设备信息化模型以及工作状态。(3)物料知识库 物料的图片、数据手册,供应、仓储状态以及物料的信息化模型等参数。(4)工具模具知识库 工具模具的图片、数据手册、使用状态以及信息化模型。(5)工业标准知识库 行业标准文本数据库。(6)设计方案知识库 电路设计、结构件设计以及相关的技术文档。形成一个典型专家数据存储系统,根据以往的设计方案和成功应用的案例进行积累和迭代。(7)工艺设计知识库 工艺设计方案以及工艺流程,面向工艺流程建模。形成一个典型专家数据存储系统,根据以往的工艺方案和成功工艺案例进行积累和迭代。(8)产品案例知识库 产品数据手册,使用说明书、图片、视频等数据。(9)GIS 库 地理信息的记录,上下游公司地理信息、公司内部生产要素的地理信息。(10)模型与数值知识库 电路仿真模型、产品仿真模型以及生产可行性和市场预测等模型。(11)供应链、产品追溯知识库 与供应链相关的信息。(12)应用场景和产业信息知识库 场景描述的文本、图片和视频等信息,产业市场与技术相关的信息库。智能家电与生成式人工智能大模型:创新与发展白皮书 第 18 页(13)法规政策知识库 法律文档、案例等数据。(14)元数据知识库 存储元数据用于有效地管理各种数据库。(15)物理信息模型库 物理信息数字孪生,提供模拟实际生产环境的虚拟空间的通用模型数据。(16)开发者数据知识库 为开发者二次开发提供独立存储,受到物理信息系统的数据支持。基于物理信息平台的智能设计支持系统,在统一大数据基础上结合各类知识库,提供对设计方案和工艺流程的深度优化能力,为开发者提供开放的软件平台,让开发者自由的进行二次开发,从而提高设计和知识运用的效率,实现知识的自动积累、共享和重用。3.3 国产生成式人工智能大模型的未来发展趋势国产生成式人工智能大模型的未来发展趋势 随着 OpenAI 开发的 GPT-4 语言模型受到世界广泛关注,各国都意识到了生成式人工智能大模型将对国家发展将产生深远影响,同样国产大模型的研发也成了目前中国重点支持的技术方向。国产大模型未来的发展,将呈现以下几种发展趋势:更大的模型更大的模型:随着计算能力和数据量的增长,通用模型规模将会越来越大、性能越来越强。更有效的训练更有效的训练:研究者们正在寻找更有效率的模型训练方法,例如:更好的优化器,更快的并行训练技术,以及使用更少数据得到更好性能的方法。更多模态的信息处理更多模态的信息处理:未来,中国的人工智能模型可能会更加专注于结合和解析多种类型的数据,例如文本、图像、音频和视频。这种多模态学习使得 AI能更好地理解交互复杂的现实世界。更强的领域专业化更强的领域专业化:未来可能会有更多的模型针对特定的应用领域进行专门的训练和调优,如家居、教育、医疗、金融和政务等领域。发展生成式人工智能大模型是一项复杂任务,它需要巨量的硬件投入和大量智能家电与生成式人工智能大模型:创新与发展白皮书 第 19 页的存储、计算资源。此外,训练这类模型还强烈依赖于大规模的专业领域数据集。为了推动通用大型模型在未来智能家居等行业的开发,依托国家级创新中心,实现数据资源的共享和利用。同时,行业联盟与头部大模型企业合作,可以借助其在大模型建设方面的专业知识和经验,共同推动专业领域大型模型的研发。通过这种合作方式,可以消除重复的研究和开发,加速领域内的科学进步,并实现技术互利互惠。未来,多模态生成式人工智能模型的实现将给智能家电带来更多好处。结合图像、语音和传感器数据等多种感知技术,智能家电可以更好地感知客户需求。例如,智能摄像头和语音识别技术可以捕捉用户情绪和行为,从而自动调节环境并提供个性化服务,实现更好的人机互动体验。此外,多模态生成式人工智能模型还能创造更具创意的智慧家居场景。通过综合不同感知模态的信息,模型可以生成更丰富、个性化的智慧家居场景。例如,根据用户的口味偏好和天气状况,模型可以生成智能厨房的烹饪建议,并自动调节烹饪设备。这些创意场景将使智慧家居更具个性化和趣味性。3.4 生成式人工智能大模型在行业细分领域的垂直应用前景生成式人工智能大模型在行业细分领域的垂直应用前景 生成式人工智能大模型的兴起不仅标志着 AI 能力的突破,更通过改变生产力与生产关系,为整个时代带来了前所未有的机遇。首先,它进一步释放了生产力,原本费时费力的业务生产运作和复杂事件处理,可以借助大模型进行改善。此外,大模型提高了生产效率,它能够高效快速地生产出专业、有效的内容,如代码生成、知识问答、文档检索等。同时,国产化通用性大模型推动了数字化高质量发展,符合当前国情需要。因此,生成式人工智能大模型- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 智能 家电 生成 人工智能 模型 创新 发展 白皮书
咨信网温馨提示:
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【Stan****Shan】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【Stan****Shan】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【Stan****Shan】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【Stan****Shan】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
关于本文