分销赏收藏举报申诉 / 19

立即下载开通VIP

当前位置：首页 > 研究报告 > 其他 > 2021量子位白皮书-虚拟数字人深度产业报告.pdf

2021量子位白皮书-虚拟数字人深度产业报告.pdf

上传人：宇***

文档编号：4092336

上传时间：2024-07-29

格式：PDF

页数：19

大小：4.19MB

《2021量子位白皮书-虚拟数字人深度产业报告.pdf》由会员分享，可在线阅读，更多相关《2021量子位白皮书-虚拟数字人深度产业报告.pdf（19页珍藏版）》请在咨信网上搜索。

1、虚拟数字人深度产业报告技术背景篇定义、关键词、分类、技术细节市场规模、发展阶段、细分场景及判断、产业链、竞争格局、中外对比、产业瓶颈产业现状篇1量子位硬科技深度产业报告虚拟数字人核心观点如需进一步交流探讨、加入垂直社群等，请联系量子位官方或量子位分析师：刘萌媛（请标注所在单位+职位）邮箱：1.虚拟数字人的三大特征是虚拟化、NLPCV语音等多种技术共同成熟、高度拟人化。在技术层面上分为灵活的真人驱动型和基于深度学习的计算驱动型。2.在2030年，我国虚拟数字人整体市场规模将达到2700亿。身份型虚拟数字人约1750亿。服务型虚拟数字人总规模超过950亿。目前市场仍处于前期培育阶段。3.虚拟数字人

2、的应用可分为服务型虚拟人和身份型虚拟人。替代真人服务中的虚拟主播和虚拟IP中的虚拟偶像是目前的市场热点。4.虚拟数字人产业链。各厂商规划在未来对核心技术进行外包。6.国内外在细分市场上的竞争差异较大，具体包含技术层面、商业模式、细分市场及发展路线。7.行业门槛及瓶颈主要来源于三方面：上限偏高的技术及美术门槛；客户积累带来的业务认知；在各细分市场亟待实现的标准化复制特别感谢：魔珐科技、相芯科技、追一科技、中科深智、火山引擎、小冰公司、黑镜科技、科大讯飞、搜狗、百度及相关行业从事者对本报告的深度参与（排名不分先后）。量子位硬科技深度产业报告虚拟数字人技术背景虚拟数字人指存在于非物理世界中，由计算机

3、图形学、图形渲染、动作捕捉、深度学习、语音合成等计算机手段创造及使用，并具有多重人类特征（外貌特征、人类表演能力、人类交互能力等）的综合产物。市面上也多将其称为为虚拟形象、虚拟人、数字人等，代表性的细分应用包括虚拟助手、虚拟客服、虚拟偶像/主播等。1.1 定义人在外表、行为、交互行为等方面高度拟人化，外在表现和交互效果已成为核心发展路线外表：虚拟数字人的面部长相和整体形象。会受到虚拟数字人类别（如直接借用真人形象、高保真建模、风格化）、制作细节（对汗毛、皮肤、头发等细节的建模）、渲染水平、设计审美等影响行为：虚拟数字人的面部表情、形体表达、语音表述等。会受到驱动方式（真人驱动、计算驱动、预制

4、调节等）、驱动模型类别（精细面部肌肉驱动、语音合成模型中对语气词、韵律的处理等）、训练数据、驱动模型精度等影响交互：虚拟数字人与现实世界的交互水平，包括回答内容、肢体反应等，会受到语音识别能力、自然语言理解及处理水平、知识图谱、预先设置知识库等影响。虚拟存在于非物理世界中，不同场景实现难度不同目前，虚拟数字人主要以图片、视频、实时直播、实时动画等方式存在于电子屏中，如APP、小程序、软硬一体显示设备。在未来，VR设备与全息投影也将成为其重要存在方式。需注意的是，尽管其存在方式均在非物理世界中，由于各场景所需的时延（如直播等实时场景要求低时延，但内容生成场景无该要求）、驱动方式（计算驱动对模型的

5、深度学习能力有极高要求）等不同，对技术、运营等要求差异较大。数字依托多项技术存在，相关技术成熟成为其发展重要推动力虚拟数字人是典型的多技术综合产物。除CG建模+真人驱动的类别外，多模态技术与深度学习成为其核心点。该部分将在技术中详细展开。多位从业人员认为，虚拟数字人近年的发展来源于CG（Computer Graphics，利用计算机进行视觉设计和生产）、语音识别、图像识别、动捕等相关技术的共同成熟。英雄联盟 Seraphine风格化三星 Neon 基于真人采集Unreal Engine Metahuman Creator高保真建模Genies 基于真人明星的虚拟数字人风格化其具体特征可拆分为“

6、虚拟”、“数字”及“人”三个部分。在试用了相关产品后，我们认为，“人”是其中的核心的因素。高度拟人化为用户带来的亲切感、关怀感与沉浸感是多数消费者的核心使用动力。能否提供足够自然逼真的相处体验，将成为虚拟数字人在各个场景中取代真人，完成语音交互方式升级的重要标准。1UneeQ 虚拟助手相芯科技虚拟客服魔珐科技漫画IP齐麟虚拟直播搜狗&新华社虚拟主持人新小微Source：UneeQ官网，相芯科技产品手册、魔珐科技产品手册、网络公开报道量子位硬科技深度产业报告虚拟数字人真人驱动型技术流程1.形象设计及建模基于IP设计或真人偶像绘制原画，进行面部及身体3D建模，选择关键点2.建模绑定将识别关键

7、点映射至模型上，进行绑定。关键点绑定的数量及位置影响最终效果。3.表演捕捉利用动作捕捉设备或特定摄像头+图像识别，捕捉在形体、表情、眼神、手势等方面的关键点变化。4.驱动及渲染真人演员（在虚拟偶像中称为中之人）根据制作需要进行相应表演，实时驱动虚拟数字人表演。在较为精细的制作中，会需要根据真人演员和建模的区别进行重定向，并对动作、眼神、手指等采用不同的驱动方式。需要时需进行语音合成，形成特定设置语音5.生成内容，进行互动进行直播，或录制其动作生成内容在计算驱动型中，虚拟数字人的语音表达、面部表情、具体动作将主要通过深度学习模型的运算结果实时或离线驱动，在渲染后实现最终效果。计算驱动的虚拟数字人

8、最终效果受到语音合成（语音表述在韵律、情感、流畅度等方面是否符合真人发声习惯）、NLP技术（与使用者的语言交互是否顺畅、是否能够理解使用者需求）、语音识别（能否准确识别使用者需求）等技术的共同影响。尽管在特定方向上，各感知类技术已有的商业化能力已足以支撑，然而，但要达成理想的综合效果，需要该公司在三个方面同时具有较强的综合能力。这也间接导致国内开展计算驱动型虚拟数字人业务的公司，大多是在感知技术方面有较强的综合实力，相对成熟的AI技术公司。计算驱动型技术流程1.设计形象。扫描真人形态及表演、采集驱动数据利用多方位摄像头，对通用/特定模特进行打点扫描（视最终需求可进行全身或局部扫描），采集其说话

9、时的唇动、表情、面部肌肉变化细节、姿态等数据从技术层面来看，虚拟数字人可以分为真人驱动型和计算驱动型。后者是近年来多模态技术和深度学习发展的技术集大成者。在真人驱动中，在完成原画建模和关键点绑定后，动捕设备或摄像头将基于真人的动作/表情等驱动虚拟数字人。由于背后有真人操作，真人驱动型在动作灵活度、互动效果等方面有明显优势，一方面能够在影视内容的创作中减低生产成本，为影视行业降低门槛，推动影视级内容向消费级转化。另一方面则多用于虚拟偶像、重要直播中，帮助虚拟数字人完成大型直播、现场路演等互动性、碎片化活动。事实上，这种技术思路可以看作是传统影视制作中，CG技术的进一步延续。近年来主要的技术突破在

10、于动作捕捉环节。随着图像识别技术，姿势、表情等识别算法的进步，昂贵的惯性或光学动捕设备不再是驱动的必备工具。普通摄像头结合理想的识别算法通用能实现较为精准的驱动（如iPhone 12摄像头已可支持简单的动作捕捉），显著降低了精细虚拟内容生成的门槛。美国虚拟主播CodeMiko采用真人驱动方法调整虚拟主播的动作及表情1.2 技术细节2量子位硬科技深度产业报告虚拟数字人计算驱动型技术流程2.形象建模，进行绑定设计所需的模型，或基于特定真人进行高还原度建模。进行关键点绑定。关键点绑定的数量及位置影响最终效果。当需要基于真人照片生成虚拟内容时，一类做法是将通用的人脸模型迁移至该真人照片上，形成虚拟形象

11、，实质为表情迁移。另一类则是生成动漫类效果，基于预先设置的形象分类算法，将真人照片中的眼型、发型等元素进行分类，并与预先设置的动漫元素进行匹配，最终生成动漫式的虚拟形象。3.训练各类驱动模型：决定最终效果的核心步骤利用深度学习，学习模特语音、唇形、表情参数间的潜在映射关系，形成各自的驱动模型与驱动方式。充足的驱动关键点配合以精度较高的驱动模型，能够高还原度的复原人脸骨骼和肌肉的细微变化，得到逼真的表情驱动模型。魔珐科技等业界领先的模型可组合出超千种表情效果，并包含眼神驱动。科大讯飞、竹间智能等公司会对语音/文本中的因素进行提取，增加情感驱动模型等。目前为止，大多数厂商的驱动模型大多是语音-唇形

12、，语音-驱动。动作、手势等驱动大多依靠人为现场指令或预设置驱动。对于需对特定真人定制化的数字化虚拟数字人，部分公司会基于在通用驱动模型的基础上，结合少量真人驱动数据训练定制化驱动模型。这种情形可视作预训练模型+小样本学习。4.内容制作：基于输入的语音（或由输入文本转化的语音），预测唇动、表情等参数核心的技术流程是基于输入的语音，或首先基于TTS技术（Text-to-speech，语音合成技术），将输入的本文转化为语音。基于语音，结合第3步得到的驱动模型，并利用生成对抗模型GAN选出最符合现实的图片，推理得到每帧数字人的图片。通过时间戳，将语音和每帧的数字人图片进行结合。5.进行渲染，生成最终内

13、容。直播时进行实时渲染为保证在特定场景下能够实现实时低延迟渲染，计算框架的大小、算力供给等技术问题同样会影响到虚拟数字人的最终生成效果附加步骤:针对需要进行交互的虚拟数字人，生产商会预先设置有问答库、知识图谱等，并承接入虚拟数字人的对话系统。当判定技术中的核心要素时，我们需要回归到虚拟数字人的核心价值，也即前面所提及的“拟人化”，这需要虚拟数字人在形象或交互上具有技术优势。在技术层面主要体现为以下三点。CG建模/图像迁移技术影响外观呈现NLP交互技术影响交互体验CV等深度学习模型影响驱动效果体现为虚拟数字人外观的拟人程度。国内外在该项上的技术差异，部分导致了目前国内外玩家主要专注于不同的细分场

14、景和发展路径以对话能力为核心。继文本对话助手、语音AI助手后，该技术继续在虚拟数字人中发挥核心作用，可以视作为虚拟数字人的大脑。在AI交互助手方面已有理想成效，如小冰等，公司能够为其添加较好的通用式互动能力。追一科技等公司则通过知识图谱、业务问答库、对话型工程引擎等增强虚拟数字人的业务互动能力。受数据量、计算框架、关键特征点等因素深刻影响。能否呈现自然的面部表情变动、肢体变动等，在极大程度上取决于语音驱动的深度模型效果。除此之外，能否对情感等因素进行特别设计，同样会产生重要影响。值得一提的是，2021年，Fable Studio的新虚拟数字人Charlie and Deck背后将有GPT-3支

15、撑，生成类语言模型的加入有望显著提升虚拟个人助手的日常交互能力，这也将是GPT-3实现商业化的全新途径。3量子位硬科技深度产业报告虚拟数字人行业现状2.1 市场规模基于国内外多家虚拟数字人厂商的业务，本报告将虚拟数字人按照其产业应用划分为两类：服务型虚拟数字人和身份型虚拟数字人。服务型虚拟数字人服务型虚拟数字人身份型虚拟数字人身份型虚拟数字人核心功能功能性，提供服务替代真人服务，完成内容生产、简单功能多模态AI助手，提供日常陪伴、关怀等服务身份性，用于娱乐/社交虚拟IP/偶像，推动虚拟内容生产虚拟世界第二分身，用于社交娱乐及Metaverse产出定位现实世界中主持人、导游、购物主播等服务型角色

16、的虚拟化具有关怀感和真实感的AI助手虚拟偶像或为真人偶像的辅助分身个体在虚拟世界（或Metaverse）中的第二分身代表应用虚拟主播、虚拟老师、标准化内容制作虚拟关怀师、虚拟陪伴助手虚拟偶像VR Chat、虚拟形象构建应用产业价值1.降低已有服务型产业的成本，为存量市场降本增效2.提升AI助手的交互效果，扩展其接受度与适用场景1.为未来的虚拟化世界提供人的核心交互中介，在增量市场创造新价值增长点2.降低虚拟内容的制作门槛经过测算，我们认为，在2030年，我国虚拟数字人整体市场规模将达到2700亿。其中，得益于虚拟IP的巨大潜力，以及虚拟第二分身的起步，身份型虚拟数字人将占据主导地位，约1750

17、亿，并逐步成为Metaverse中的重要一环。服务型虚拟数字人则相对稳定发展，多模态AI助手仍有待进一步发展，多种对话式服务升级至虚拟数字人形态，总规模超过950亿。955.41747.2服务型虚拟人身份型虚拟人35.4%64.6%840.2115.2替代真人服务多模态AI助手87.9%12.1%亿亿1474.3262.1虚拟IP虚拟第二分身服务型虚拟数字人2030年我国虚拟数字人整体市场规模人民币2703亿85.1%14.9%身份型虚拟数字人4量子位硬科技深度产业报告虚拟数字人理想的市场规模体现在虚拟数字人这一市场行业天花板高，实现路径明确，且已出现了有相当竞争力的技术公司。在各行业近两年开

18、始意识到其技术可行性和商业价值后，行业将快速进入高速发展期。首先，作为多模态升级的代表技术，虚拟数字人的应用场景众多，可广泛与各行业领域相结合，变现路径和市场潜力明确。其中虚拟直播、虚拟偶像已得到明确的商业价值验证。而虚拟分身生成等场景也已得到了资本和相关产业方的认可。其次，大多数国内玩家为综合实力较强，发展成熟的AI科技公司，在客户积累、技术实力、销售渠道、资金供给等方面较为可靠，行业预计可直接进入平稳发展期。最后，在多家业内代表公司看来，虚拟数字人作为Metaverse 主要的交互载体，具有明确的巨大增长潜力，并基于NFT、VR等有理想的延展空间。行业天花板高，能够维持长期和衍生发展。2.

19、2 行业发展阶段火山引擎、追一科技等公司基于自身观察，认为虚拟数字人行业目前仍处于孵化培育的阶段。相芯科技基于XR行业技术成熟度曲线，认为虚拟化身技术在未来2-5年内将进入稳步爬坡期。而在行业的长期发展方面，可以依据面向市场、解决方案及产品成熟度、基础设施及衍生产业进行划分。相芯科技基于自身认知，将虚拟数字人的未来发展划分为三个阶段，依次为1.B端行业探索与教育的成长期。该阶段主要用于完善行业解决方案，同时通过2B2C对C端客户进行市场教育；2.B端场景成熟向C端渗透的发展期。该阶段B端应用场景将与行业深度结合，逐渐成熟。同时厂商开始关注UGC，消费级工具、C端消费订阅制、虚拟内容生产迎来井喷

20、。3.B、C端应用成熟，并形成数字资产及经济体系，技术迭代的成熟期。基于我们的观察，目前三大阶段的对应现象均已有所出现。但目前，面向B端探索成熟的落地场景仍然为各厂商的主要关注点。据分析，虚拟数字人行业未来的主要驱动力包括：用户代际变化，新一代消费者对内容消费和虚拟世界更为渴求；虚拟数字人相关技术（如计算机图形学、深度学习等）门槛相对降低，成本有所回落；资本热度上升，受Metaverse概念和国外成功厂商引导，虚拟化的趋势逐渐成为共识；VR眼镜等相关配套设备逐渐回暖，有望实现大规模商用。2.3 细分场景及相关判断2.3.1 服务型虚拟数字人目前，国内的服务型虚拟数字人主要用于替代真人进行播报等

21、内容生成，并进行简单问答交互等。而国外则由于在CG（Computer Graphic，计算机图形学）方面具有技术优势，能够打造具有高度关怀感的虚拟数字人，率先在医疗等场景落地了虚拟陪伴助手、心理咨询顾问等。整体而言，由于虚拟数字人提供动作、表情等更多维度的信息，之前仅基于文本、图像或语音的单模态服务及内容都能以虚拟数字人的形态进行更丰富的呈现。内容方面，有声读物、文本内容等将有望快速扩展至视频领域。据相在本部分中，会对服务型虚拟数字人和身份型虚拟数字人进行具体展开，说明其核心价值、主要赛道、推动力、相关玩家及其特征，并基于分析师的观察给出一定判断。5量子位硬科技深度产业报告虚拟数字人a.替代真

22、人服务短期主要价值增长点核心价值及主要功能：代替真人进行内容生产和简单交互降低对真人表演的需求，减少标准化内容的制作成本；特定场景下（政务、金融等）客服、虚拟主播、新闻播报主要赛道：企业服务、内容行业未来推动力：业务快速更迭导致的服务类人力培养难度与成本增加；内容行业向视频时代升级的需求主要判断：需关注对拟人化有强烈需求的特定服务场景；通过知识图谱、客户积累等专注垂直行业服务的短期内更易变现；内容行业更易实现规模化复制，需强调SaaS及预设模板等标准化工具在内容生产方面，虚拟数字人内容生成平台已成为多家厂商共同的发力点。国内厂商包括火山引擎、科大讯飞、相芯科技等，平台以新闻播报为主要场景。国

23、外厂商以英国的Synthesia和Hour One为代表。中外主要差异点主要在可供选择的虚拟数字人数量，以及预设模板等线下细节。在这类平台上，使用者只需将需要播报的内容输入平台，选择主持人形象、音色、背景后，即可快速生成相关播报视频。使用者可以利用时间轴，对虚拟数字人进行动作等调节。部分产品还支持插入演示面板、根据时间轴调整位置等，最终生成图文并茂，带有解释说明的视频。尽管国内各平台的产品设计中，更多的倾向于新闻播报。但我们认为，对于产品说明书、教学内容、产品说明视频等内容相对固定，观看者对于视频灵活度无过高要求的说明性内容，都可以采用这种方式进行制作，以降低相关投入。芯科技，除去常见的课件等

24、内容生产外，部分面临着人才短缺，但希望能够融媒体转型的县市级媒体，也在试图通过有服务型虚拟人，低成本地生成所需媒体内容。服务方面，通用的语音助手、个性化顾问、车载系统，针对特定场景的指引、导览等均能够以更为人性化和易于使用的方式呈现。不过，尽管虚拟数字人似乎通用性很强，但仍需要注意，目前的制作成本仍高达百万级，需要首先关注对多模态信息和拟人化具有强烈需求的场景。HourOne的虚拟内容生成平台配有36个虚拟形象，多类标准化模板及视频管理系统Synthesis的虚拟内容生成平台配备40个虚拟形象，虚拟数字人视频内容生成领域融资最高简单交互方面，虚拟数字人不适用于通用性、专业性、交互性过强的领域，

25、会暴露其现有技术短板。国内目前多专注于特定细分市场，主要用于提供简单业务交互。虚拟主播是目前国内商业化竞争最为激烈的场景，以中科深智为代表，部分厂商开始提供一站式服务，包括客户端、布置方案、硬件系统、乃至流量运用等配套服务。个别厂家会将直播场景中的运营细节融入产品设计中，用于更好的迎合消费者心理和平台的流量分发机制。目前，虚拟直播的价格门槛已从数万级下降至数千级，使用门槛也大幅降低。其次为各家均在摸索部署的虚拟客服，据追一科技，在现有的技术条件下，业务需求和规则流程相对明确的客服场景成为虚拟数字人落地的理想方式。除去替代真人外，由于能够基于知识图谱、数据迭代等进行更快的业务知识升级，虚拟人在客

26、服等背景知识会快速更迭的领域中有独特优势。虚拟客服得以在服务现场通过软硬一体大屏、电子播报屏6量子位硬科技深度产业报告虚拟数字人等，在线上通过App等形式更好的服务客户。在这一场景中，金融领域由于对新技术接受程度较高，且能够承担目前高达数百万元的客单价，正成为主要的应用行业。其他场景还包含已在多家规划中的虚拟教师、导航导览（地铁站、医院等）、展览介绍（导览“小春妮”）等。在使用中，通过预置知识库、知识图谱、用户自主配置触发条件等等，虚拟数字人可以对用户的基本诉求进行行为和语音识别，并以固定话术进行回应。例如，虚拟主播可以以固定的几种话术欢迎进入直播间的消费者，并在消费者提及价格、存货、产品详情

27、等意图时，根据事实情况进行回应。虚拟客服则可以借助NLP技术理解用户需求并进行解答。目前，追一科技、科大讯飞等均有配有行业知识库。在教育、直播等此类场景中，尽管交互只占据虚拟数字人整体工作中的一部分，但在魔珐科技看来，问答的高转化率才是当前场景中的价值关键。追一科技同样认为互动沟通是虚拟数字人能力中最重要的部分。因此，对关键问题的识别交互能力对此类场景至关重要。为了解决这一问题，专注于此类场景的公司需要对相应的业务场景具有充足的行业知识积累，以提升其语言交互系统，并更好的对接原场景中的业务系统。b.多模态AI助手长期想象空间大，已出现领先布局者核心价值及主要功能：基于真人形象，提供关怀感和真实

28、感在通用场景或特定关怀类场景中提供顾问、关怀、陪伴、事务处理等服务主要赛道：个性化经济、单身经济、电商购物、医疗康复未来推动力：新世代对个性化顾问和服务的需求；单身/老龄化/心理脆弱等人群对关怀陪伴的需求主要判断：关注陪伴感、关怀感等心理因素的场景更易变现，如健康顾问、虚拟男友等；对虚拟数字人在形象和交互方面技术要求极高；细分场景率先发展，在与手机厂商、系统提供商达成合作后，通用式助手将大规模普及；短期内会和语音交互助手有替代关系，长期语音助手可能成为其附属交互手段多模态AI助手可以理解为助手型虚拟数字人，不仅能够在特定场景下基于用户系统高度个性化，还可以实现通用化交互。特定场景下的多模态助

29、手是国外虚拟数字人公司的业务发展重点，用于提供情感联结。医疗顾问、日常陪伴、购物客服等领域目前均已成为国外厂商的关注重点。如三星Neon的CEO，Pranav Mistry所言，“Its not because you want to know something,but you need a person to talk to”。与之相伴，是国外公司对虚拟数字人外表逼真度的追求。包括UneeQ、SoulMachines、HourOne、Neon会选择在预制虚拟数字人的设计及制作上投入大量精力。相对于国内，其预制虚拟形象在外观及行动方面，对真人的还原度有明显优势。HourOne的预制虚拟数字人

30、形象，用于网页向导等SoulMachnes为SK-提供的个性化护肤顾问形象7量子位硬科技深度产业报告虚拟数字人不同于简单的虚拟客服，特定场景中的助手是高度个性化的。除去多模态技术外，与业务相关的个性化分析及推荐系统在此场景中同样重要。目前国外厂商已有的落地场景包括个性化理财顾问、心理咨询顾问、购物助理等。除去赋能外部机构外，TwentyBN选择自主构建虚拟数字人陪伴应用。其Fiteness Ally为个性化健身教练，能够基于使用者的实时运动情况等完成个性化交互。通用化的虚拟数字人助理目前仍主要处于前期阶段。基于智能音箱等非可视化设备的语音AI助手仍为主流。尽管拥有具体形象的虚拟数字人是智能虚拟

31、助手的多模态高级形态，仍需要一定时间转化。一方面，当前AI助手多以语音为载体，如手机、音箱等，消费者已习惯在使用时不动用视觉，且设备（以智能音箱为主）并未配备有显示装置。其多模态的特性不具备相对优势，更改用户习惯需要一定时间。然而同时，在XR（Extended Reality，包括VR、AR、MR）或全息投影的方式下，具有具体形象的AI助手将具有较大意义。且此类助手将不仅存在于现实投射中，由于VR的大规模推广将重新构建底层的操作系统和消费者的感官需求，在VR世界中，如同过往游戏中的NPC，形象化的虚拟助手将承担特定场景/应用的引导员等。部分公司目前已在尝试这一方向。与AR相结合的公司Hybri

32、目前已推出首个AI虚拟助手应用。使用者可以基于照片生成虚拟形象，该形象将以AR形式持续存在，并进行简单交互。该应用目前已获得近4万使用者。而知名AI虚拟助手，包括小冰、小爱同学等，都已在为其虚拟形象定制专属虚拟数字人形象。但其目前仍处于对外展示阶段，由于对实时渲染等方面的需求，尚未广泛搭载。据三星Neon团队，他们期待Neon未来能够拥有自己的情感和记忆。但由于AI助手大多由手机厂商或底层系统上进行开发，技术成熟后的增长可能是爆发式的。据ResearchAndMarketsGlobal Intelligent Virtual Assistant Market（2020 to 2027）预测，到

33、2027年，全球智能虚拟助手市场规模预计将达到451亿美元，复合年增长率为340，可从中对虚拟数字人助手的市场规模有所想象。在多模态AI助手领域，其规模增长关键在于相关设备的成熟，例如中老年市场的手机终端，物联网终端，VR眼镜的推广、甚至可能车载HUD的车载助手中。Hybri的虚拟AI助手小爱同学的虚拟形象（小米公司）三星助手虚拟形象Sam2.3.2 身份型虚拟数字人与缺乏人格象征的服务型虚拟数字人相比，身份型虚拟数字人更强调其本身的身份。一方面，在现实世界中，具有独立人设的虚拟IP能够通过静态（照片）、动态（视频）、实时（直播）等方式引发关注及变现。另一方面，为每个人未来的虚拟世界乃至Met

34、averse中创造专属身份，将成为必然趋势。尽管对个性化身份的诉求已经长期存在，但在黑镜科技看来，身份仍大多以profile的形式存在，仅仅是一个过渡形态，人始终需要全感官的参与。虚拟数字人本身及其衍生市场都将迎来长足的发展。8量子位硬科技深度产业报告虚拟数字人a.虚拟IP/偶像细分市场相对成熟，文娱领域重要增长点核心价值及主要功能：满足IP运营的视频化、碎片化、实时化需求；创造更为稳定、易得、低成本的IP 创造全新虚拟数字人IP；或将漫画、小说等IP立体化运营主要赛道：文娱领域未来推动力：新世代对虚拟化内容的向往；使用真人IP的风险增加；品牌方对定制化代言人的需求主要判断：我国的虚拟IP在网

35、红/直播领域更易爆发；面向广大用户的低门槛工具将成为重要增长点；由于能够帮助各类IP实现直播、现场路演等形式，文娱体系整体连接将加强，各类IP易实现全渠道运营；对IP的运营能力成为公司实力的重要象征虚拟IP指其在现实世界中并不存在对应的真人，其外貌特征、基本人设、各类偏好、背景信息等均由人为设定。虚拟IP存在两种方式，全新创造的IP，以及基于文本、漫画、游戏中的原有IP，立体化后的可交互、可多渠道运营的虚拟IP。尽管在虚拟IP领域，大多会采用真人驱动的方式进行运营，但对应的真人演员（在二次元界也成为“中之人”）与虚拟IP本身并无强绑定关系。Gensis等为明星创造虚拟形象的公司，国内黄子韬，迪

36、丽热巴的虚拟化身本质上是真人偶像身份的延续，用于代替真人进行相关表演，属于替代真人服务中的一种，主要用于帮助真人明星增加其曝光率，并非此处所指的虚拟IP。目前，虚拟IP的商业价值已经得到了充分验证。最为知名的虚拟IP Lil Miquela2020年收入超千万美元，而在国内，虚拟IP翎已登上Vogue杂志，并获得特斯拉代言。除去传统的偶像渠道外，直播及网红也成为虚拟IP的重点发展市场。代表IP包括美国主播CodeMiko，中国抖音网红阿喜，中国B站网红鹿鸣、日本Imma。整体而言，虚拟IP相对于真人IP，解决了MCN对特定IP长期稳定持有的问题，以偶像/网红为核心场景，在直播、代言等领域均有所

37、发展。相对真人IP可能出现各类突发事件，收费昂贵、品牌方难以积累自有流量的问题，虚拟偶像由于可以依托机构进行运作，人设稳定，可高频次出席相关品牌活动。此外，由于我国的短视频和直播业态正在迅速发展，面对高频、碎片且实时的IP运营需求，虚拟IP更能够适应这一趋势。根据魔珐科技的客户经验，相对于传统动画公司，除传统的长内容领域外，垂直虚拟数字人公司在技术及内容制作方面更能够满足目前的短视频及直播需求。虚拟偶像方面，在初音未来、洛天依等成功案例下，目前国内已出现了专门的虚拟偶像经纪公司，SM等国内知名娱乐公司在为真人偶像创造虚拟形象的同时，开始打造虚拟偶像。在虚拟偶像方面，大多采用文娱公司+技术公司联

38、合打造的方式。由文娱公司进行前期的形象设计、人设打造，以及后期的流量、活动运营等，由技术公司提供虚拟数字人相关技术，并为具体互动提供技术支持。据次世文化，单个虚拟偶像的孵化周期大约在45天左右，以一年半为理想的使用周期。但多家虚拟形象技术公司向我们表示，将在未来关注自身的IP运营能力，并针对特定内容呈现场景发掘潜力赛道，培养对应的虚拟IP，成熟后进行经验复制。在这一领域，对内容行业的深入了解和技术一同成为了参与公司的硬性门槛。韩国SM公司推出的新女团Aespa一半成员包含虚拟偶像美妆品牌花西子同名虚拟代言人穿越火线游戏IP 灵狐在斗鱼进行现场直播9量子位硬科技深度产业报告虚拟数字人而直播领域则

39、为我国虚拟文娱的发展特色，是虚拟数字人UGC（User-Generation Content）的典型代表，在创造商业价值的同时，有助于激发大众对于虚拟世界的适应力和想象力。包括爱奇艺、B站、淘宝直播、虎牙直播、酷狗音乐、腾讯、抖音平台都已经开始使用虚拟主播。由于虚拟数字人技术使视频类和实时演绎类运营的门槛降低，小说IP（阅文集团等）、漫画IP（齐麟等）、游戏IP（灵狐等）等也正在积极通过虚拟数字人技术，使原有单一模态的IP能够实现直播、线下路演等，获得了IP运营新的价值增长点。C端直播的软硬全栈解决方案正在成为多家厂商的共同发力点，由于潜在市场规模巨大（直播市场目前市场规模约1.5万亿），这一

40、细分市场也是目前最易出现跨界竞争者的领域。代言领域，欧莱雅（M姐）、花西子（花西子）已开始有所尝试，通过虚拟IP打造完全符合品牌调性的虚拟代言人。在完成虚拟代言人打造后，可将该特定IP延展至客服等衍生的虚拟数字人领域，持续加深品牌印象，出于品牌对宣传效果的考虑，对虚拟数字人的形象质量和交互效果有极高的要求。因此，此类代言人的相关活动大多交由魔珐等CG类厂商，通过真人驱动达成。在面向平台或特定品牌提供了虚拟偶像、虚拟代言人等B端产品后，身份型虚拟数字人公司将转向面对C端的轻量化产品，通过降低软硬件要求、减少成本等方面赋能虚拟数字人UGC，实现人人可虚拟。据公开渠道，目前单一虚拟数字人的制作成本已

41、从六位数下降了五到十倍。b.虚拟世界第二分身需求得到过往验证，需要相关基础设施支撑核心价值及主要功能：满足个人对虚拟身份的需求为社交、娱乐、Metaverse设计脱离于现实世界的第二分身主要赛道：互联网社交、游戏、虚拟内容未来推动力：新世代对虚拟化内容的向往；Metaverse带动的虚拟数字人基础设施普及率（以年为单位进行迭代）主要判断：在用户需求方面已得到过往捏脸应用的充分认证，市场潜力明确；社交为其天然的适用场景，高开放性的社交类游戏可能成为其首先爆发点；Metaverse基础设施构建、XR设备规模化出货都会成为重要推动因素分身型虚拟数字人主要面向的是未来的虚拟世界，把为每个人创造自己的

42、虚拟化分身为最终目的，满足个人在虚拟世界中的身份需求。为自己创造独特的形象在社交、游戏等领域被反复验证过，QQ秀、Nepeto、Anmoji、逆水寒等的成功都与这种底层需求紧密相连，但过往多为低还原度的平面形象，虚拟第二分身将有望通过其特有的真实感和沉浸感进一步满足这种分身需求。且用户需要在虚拟形象的创造上拥有更多话语权。基于虚拟身份，还可能出现以NFT服饰等为代表的虚拟消费市场。在与VR从业者交流后，我们发现，尽管高还原度的个性化外表有助于提升第二身份的沉浸感。但核心问题在于交互手段。第二身份的核心在于精细的描述使用者当前的反应姿态，包括位置、外貌、注意力、情绪等一系列要素，才能为使用者提供

43、基于第二身份的存在感。因此，第二分身虚拟数字人的普及需要一系列基础设施完善。在虚拟产业的内容、硬件、软件等方面基本成熟后，虚拟数字人将有望迎来快速爆发。社交领域为目前主要的应用场景，国内包括号称“社交元宇宙”的Soul，带有面部捕捉功能的Vyou，各类VR chat应用的等。英伟达甚至将其应用于视频会议中，通过其Vid2Vid Cameo帮助使用者以固定的真人形象参加视频会议。与Metaverse 概念的结合，为虚拟数字人的第二身份定位提供了充足的想象空间。相芯科技将虚拟形象视为用户与虚拟世界链接交互的第一入口。在基于虚拟形象的交互中，参与者得以进行虚拟生产和劳动，并最终形成虚拟生产和社会关系

44、。在10量子位硬科技深度产业报告虚拟数字人业内人士的想象中，在未来的Metaverse中，虚拟数字人将作为品牌为用户提供服务的核心中介，在作用上等同于目前的APP。Metaverse方面，部分厂商已有所行动。Wolf3D（Ready Player Me头像制作器）、Unreal Engine（MetaHuman Creator）、Oculus（Avatar SDK2.0）、Loom.ai（对外开放其API，已被Roblox收购）均已为用户提供生成个人虚拟形象的平台，用户可在生成后将带有绑定的角色直接导入VR游戏、VR Chat、内容工具等进行使用。Oculus表示，用户创建的虚拟化身最终会以某

45、种形式出现在Facebook、Messenger、Instagram等应用中。2.5 竞争格局及中外对比从竞争格局来看，无论在国内还是国外，虚拟数字人的竞争格局都尚未成熟，行业集中度相对较高。尽管玩家数量在快速增长，但由于行业对综合的技术实力和合作渠道能力要求较高，具有相当实力的头部公司仍相对有限。在中国，在虚拟直播、虚拟偶像等潜力确定的细分市场，出现部分针对中小客户、或承接经纪等延展业务的专业虚拟数字人公司。国内外在细分市场上的竞争差异较大。国内外目前的共同市场是自动生成虚拟内容，但由于在外表细节、预设模板、配套系统等方面的差异，国外在该细分市场具有较为明显的产品和客户优势。此外，虚拟偶像受

46、到较多的共同关注，亚洲地区文娱公司等产业方的参与尤为突出。而在其他市场上，国外更关注情感关怀的顾问/助手类虚拟数字人和用于打造虚拟数字人的应用，而这两个细分市场在国内并无太多发展。国内的玩家更关注虚拟客服类场景。对虚拟直播的高度关注成为我国玩家的特有方向。2.4 虚拟数字人产业链尽管目前大多国内厂商选择对形象、语音、语言等多方面进行自研，但多家厂商已明确表述，未来会将非自身核心的技术部分进行外包。目前，我们已经从个别头部公司处了解到，多家不同类别的虚拟人厂商正在以各自的核心技术能力达成合作，在教育等领域快速试水。这一趋势将与国外产品目前的商业模式相似。11上游内容制作类工具类IP策划类提供虚拟

47、数字人相关资产，此类公司大多自主研发虚拟人，同时将特定资产对外开放合作，支持个性化定制如原画（原力、数字王国等）、原始形象（Datagrid利用GAN生成无版权问题的图形，微软虚拟化身资源库RocketBox、数字人类联盟Digital Human League）、交互能力框架（小冰）、情感框架（搜狗）、声音框架等。建模及绑定渲染动作捕捉设备（惯性/光学）IP孵化、形象设计、后期运营等下游品牌代言（身份型）文娱领域（服务/身份型）讯息播报企业服务（服务型）UGC平台PGC及MCN金融通信商政务各类企业APP教育医疗中游综合类/互联网技术厂商专长类AI厂商CG厂商XR厂商垂直虚拟人厂商（单点）*

48、依据公司本身的经营特性与重点业务领域划分，该分类将间接体现不同公司在虚拟人领域的能力发展方向侧重。此处仅对国内厂商进行分类介绍，国外厂商介绍请参照中外产业对比部分垂直虚拟人厂商（全栈）（含自研动捕设备）（含自研智能建模及绑定，表演捕捉，AI全智能虚拟数字人等）量子位硬科技深度产业报告虚拟数字人整体而言，国内外在细分市场上的竞争各家仍处于试验产品可行性、打造标杆客户的阶段，距离商业化规模推广仍具有一段距离。从整体对比来看，我们发现，与差别主要存在于具体技术和产品的其他技术领域不同，中外的虚拟数字人厂家在具体玩家、技术水平、关键场景、产品形态、运营方式等方面都具有明显的差别。综合来看，这种差异实质

49、上是行业性的差异。通过综合考察中外玩家之后，我们认为这种体系化的差异起源于技术，但同时也是我国直播业态兴起、互联网元素复杂、人口基数大等多方面因素共同助推而成的。但基于对虚拟数字人本质的理解，我们认为，在未来，中外依旧会在具体的使用场景上有所合并。这种体系化差异不应当被理解为不同的发展速度，未来即便是在同一细分市场，也可能会出现完全不同的业态。2.5.1 国外主要玩家公司名称公司定位融资状况典型市场公司特性UneeQ人性化的AI互动服务，强调拟人化的情绪带来的商业价值提升2018年A轮1000万美元医疗康复/心理关怀顾问、虚拟客服、品牌大使项目制和订阅制并行，单个定制化项目周期为6个月（2个月

50、深度涉及，4个月数据收集及算法训练，2个月进一步调整）产生的数字人可在PC、手机等多种终端运行在NLP方面高度兼容，兼容各类数据库、知识库、NLP及聊天机器人系统Soull-Machines人性化的人机交互系统，强调Engage with customers与虚拟形象AGIB轮5750万美元总额6500万美元产品顾问、网站客服、虚拟购物助理、在线银行客服、医疗保健助理等通过其构建的完整流程、预设库（Human OS Platform）和创建平台（The digital DNA Studio）,使用者可以构建具有不同性格、外表、价值观的虚拟数字人Samsung Neon提供视频聊天机器人-财务顾

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档保存到电脑，查找使用更方便

10 金币 0人已下载

申诉本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请申请举报、认领或删除 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 2021 量子白皮书虚拟数字深度产业报告

咨信网温馨提示：
1、咨信平台为文档C2C交易模式，即用户上传的文档直接被用户下载，收益归上传人（含作者）所有；本站仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿，我们不确定上传用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的版权、权益或隐私，请联系我们，核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据，个别因单元格分列造成显示页码不一将协商解决，平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺，下载前须认真查看，确认无误后再购买，务必慎重购买；若有违法违纪将进行移交司法处理，若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传，付费前请自行鉴别，如您付费，意味着您已接受本站规则且自行承担风险，本站不进行额外附加服务，虚拟产品一经售出概不退款（未进行购买下载可退充值款），文档一经付费（服务费）、不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印，是因预览和防盗链等技术需要对页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有水印标识（原文档上传前个别存留的除外），下载后原文更清晰；试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓；PPT和DOC文档可被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；PDF文档不管是原文档转换或图片扫描而得，本站不作要求视为允许，下载前自行私信或留言给上传者【宇***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用；网站提供的党政主题相关内容(国旗、国徽、党徽－－等)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
6、文档遇到问题，请及时私信或留言给本站上传会员【宇***】，需本站解决可联系【微信客服】、【 QQ客服】，若有其他问题请点击或扫码反馈【服务填表】；文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“【版权申诉】”（推荐），意见反馈和侵权处理邮箱：1219186828@qq.com；也可以拔打客服电话：4008-655-100；投诉/维权电话：4009-655-100。

关于本文

本文标题：2021量子位白皮书-虚拟数字人深度产业报告.pdf
链接地址：https://www.zixin.com.cn/doc/4092336.html

宇***

内容提供者

实名认证

查看上传人更多文档

部分上传会员的收益排行 01、路***（￥15400+），
02、曲****（￥15300+），
03、wei****016（￥13200+）,
04、大***流（￥12600+），
05、Fis****915（￥4200+），
06、h****i（￥4100+），
07、Q**（￥3400+），
08、自******点（￥2400+），
09、h*****x（￥1400+），
10、c****e（￥1100+）,
11、be*****ha（￥800+），
12、13********8（￥800+）。

相似文档

自信AI助手