人工智能基础数据服务白皮书.pdf
《人工智能基础数据服务白皮书.pdf》由会员分享,可在线阅读,更多相关《人工智能基础数据服务白皮书.pdf(25页珍藏版)》请在咨信网上搜索。
人工智能基础数据服务白皮书2023/03人工智能基础数据服务白皮书 2023。欲了解更多信息,请联系德勤中国。核心观点核心观点整体市场整体市场:人工智能产业的快速增长带动了人工智能基础数据服务市场的蓬勃发展人工智能基础数据服务市场的蓬勃发展,自动驾驶是未来五年最重要的应用领域自动驾驶是未来五年最重要的应用领域发展趋势:发展趋势:标注复杂化、自动化、全栈式服务需求以及愈加严格的数据合规需求是AI基础数据服务市场的四大趋势竞争格局:竞争格局:传统的专业型基础数据服务商仍是行业重要组成,但科技巨头企业依托其科技实力和强大资源,逐渐占据竞争优势科技巨头企业依托其科技实力和强大资源,逐渐占据竞争优势结构化数据是人工智能算法开发迭代的重要基础,人工智能基础数据服务市场受人工智能核心产业发展带动仍将保持高速增长,预计2027年市场规年市场规模有望达到模有望达到130-160亿元。亿元。自动驾驶自动驾驶是人工智能基础数据服务市场占比最大的下游应用,随着自动驾驶算法技术不断迭代与场景落地,未来占比有望进一步提升。未来占比有望进一步提升。标注复杂化:标注复杂化:随着算法迭代创新以及场景功能的持续扩展,数据标注元素和标注信息维度均将大幅增加,对于数据基础服务供应商提出了更高的要求;自动化标注:自动化标注:AI赋能的自动标注工具逐渐成为基础数据服务商和AI算法公司降本增效的利器,推高行业集中度;全栈式服务:全栈式服务:下游算法应用方自研人工智能算法的趋势逐渐显现,需求方对于“基础数据服务+云资源+工具链”的全栈式服务需求提升(包括算法公司,但主要由应用方驱动),特别是对于工具链产品的需求将随着商业化场景的成熟由自动驾驶领域向各行各业拓展,适应未来的迭代需求;从自动驾驶基础数据服务需求方的角度出发,整车厂及整车厂及Tier1自研需求不断提升,自研需求不断提升,同时技术迭代带来的更复杂、更专业的数据标注需求,这将推升整个自动驾驶行业的基础数据服务外包需求,并进一步释放对工具链及全栈式服务的需求。并进一步释放对工具链及全栈式服务的需求。数据合规性:数据合规性:数据安全法律法规体系不断完善,基础数据服务商在数据脱敏、数据采集的测绘资质要求等环节的专业性价值会为其带来竞争优势。科技巨头、专业型基础数据服务商以及科技初创企业是人工智能基础数据服务行业的主要参与者,其中专业型基础数据服务商布局早,服务经验积累深,在市场中仍占有较大份额,而科技巨头近两年发力明显,快速抢占市场;自动化标注、专业数据采标及全栈式服务是人工智能基础数据的三大核心能力,其中领先的科技巨头在三个维度均有持续的积累,综合能力最强。以百度为代表的科技巨头依托其研发能力、产业链协同资源和对AI算法的理解、稳定和专业的标注团队,竞争优势显著,市场份额有望持续提升。人工智能基础数据服务白皮书 2023。欲了解更多信息,请联系德勤中国。目录目录章节章节页码页码第一章:人工智能,数据先行:第一章:人工智能,数据先行:AI基础数据服务持续快速发展基础数据服务持续快速发展4第二章:第二章:AI基础数据服务趋势:复杂化、自动化、全栈化及合规化基础数据服务趋势:复杂化、自动化、全栈化及合规化12第三章:科技巨头已下场,强者优势愈发清晰第三章:科技巨头已下场,强者优势愈发清晰19人工智能基础数据服务白皮书 2022。欲了解更多信息,请联系德勤中国。人工智能基础数据服务白皮书 2023。欲了解更多信息,请联系德勤中国。存在大量针对黄恐暴、抄袭等方面的内容审核需求,但人工审核效率低、成本高传统客服也面临成本高昂的问题人力工序过程失误率高,且难以追溯部分工作环境存在高危性国内医疗水平参差不齐,基层卫生医疗水平低下,有经验的医生资源稀缺新药设计难度大、成本高且耗时传统安防无法准确识别人、物与场景犯罪、恐怖袭击等事件无法预知人口红利消失,驾驶员成本高且资源短缺超载及疲劳驾驶导致安全事故频发,造成生命财产损失采用语音识别、语义切割、图像识别等方式对内容数据进行识别分类,高效实现审核工作ChatGPT的诞生大大加快了人机交互的效率与应用利用计算机视觉技术高效准确发现瑕疵品机器人代替人在危险场所完成工作智能影像识别可以通过自动读片快速进行疾病筛查,弥补医疗资源差异AI制药能够以更低成本高效发现药物靶点、筛选化合物,大幅提升新药研发效率通过计算机视觉等技术实现人脸识别,从而发现嫌疑人行动轨迹进出楼宇与园区时采用指纹或人脸识别提高识别精确度自动驾驶通过传感器、计算机视觉等技术逐步解放驾驶员,实现车辆的自主驾驶中国人工智能产业处于高速增长期,正在加速向各行各业渗透,包括互联网娱乐、智能制造、智慧医疗、智能安防及自动驾驶等,而自动驾驶等应用场景的复杂性又反向推动了人工智能的迭代演进互联网娱乐互联网娱乐智能制造智能制造智慧医疗智慧医疗智能安防智能安防自动驾驶自动驾驶信息来源:德勤访谈、研究与分析人工智能主要应用场景人工智能主要应用场景场景痛点场景痛点AI解决方案解决方案AI应用场景复杂性应用场景复杂性高低AI精度要求精度要求人工智能正在加速渗透应用到各行各业人工智能正在加速渗透应用到各行各业人工智能基础数据服务白皮书 2023。欲了解更多信息,请联系德勤中国。开发流程开发流程数据价值数据价值数据需求量数据需求量结构化数据是人工智能算法模型开发和迭代算法模型开发和迭代的基础,从设计、训练、评测、仿真到整个算法更新迭代的全生命周期都需要持续不断的结构化数据的输入作为支撑信息来源:德勤访谈、研究与分析人工智能算法模型开发流程人工智能算法模型开发流程 从数据源采集包括图像、语音、文本、点云等形式在内的算法所需数据,通过标注,将非结构化数据转化为计算机语言下的结构化数据,通过标注,将非结构化数据转化为计算机语言下的结构化数据,结构化数据是人工智能算法开发的基石结构化数据是人工智能算法开发的基石 需要大量结构化大量结构化数据数据进行模型训练 需要根据场景挖掘构建场景库构建场景库,并进行仿真测试仿真测试 需要经过标注的测试数据集测试数据集进行对照验证结构化数据结构化数据训练训练仿真仿真评测评测设计设计 需要持续的一定持续的一定量数据输入量数据输入进行算法模型迭代 通过海量结构化数据训训练人工智能算法模型练人工智能算法模型,使人工智能算法得以落地实践 通过数据建模建立接近真实世界的测试场景并进行算法可行性测试验进行算法可行性测试验证,例如自动驾驶场景证,例如自动驾驶场景或智能制造场景或智能制造场景 通过人工数据标注结果与模型标注结果比对进行算法模型的评测,判判别算法模型识别准确性别算法模型识别准确性 通过感知训练评测平台根据实际场景和技术趋势对算法进行可持续性持续性的、针对性的更新迭代的、针对性的更新迭代和算法和算法bug修复修复 明确选择算法的核心目标,并从数据中提取有从数据中提取有效信息效信息以进行算法模型的选择和设计 分析小批量数据分析小批量数据特性特性以设计算法模型迭代迭代人工人工智能智能算法算法模型模型开发开发结构化数据是人工智能快速发展的基石结构化数据是人工智能快速发展的基石高低人工智能基础数据服务白皮书 2023。欲了解更多信息,请联系德勤中国。人工智能基础数据服务商处于产业链中游,通过提供数据采集和标注服务,连接上游数据来源方和下游人工智能算法研发方人工智能基础数据服务商处于产业链中游,通过提供数据采集和标注服务,连接上游数据来源方和下游人工智能算法研发方 市场上现存的大量数据均为非结构化数据,无法直接应用于人工智能算法的研发与训练,需要通过数据的采集与标注将其转化为结构化数据,以供下游人工智能算法研发商使用。这个采集与标注的过程逐渐形成了一项专项工作,主要由专业的基础数据服务商来提供,少量由算法研发企业的自有团队执行基于结构化数据的重要性,人工智能产业逐渐诞生了一批专业人工智能基础数据服务商通过数据采集与数据标注,有效衔接数据源与具有算法开发需求的企业人工智能基础数据服务产业链人工智能基础数据服务产业链1注释:1.产业链图谱中代表厂商为不完全列举,排名不分先后信息来源:德勤访谈、研究与分析数据产生源数据产生源产业链上游产业链上游产业链中游产业链中游产业链下游产业链下游人工智能基础数据采集与标注人工智能基础数据采集与标注人工智能算法研发人工智能算法研发AI基基础础数数据据服服务务商商语音语音图像图像视频视频文本文本点云点云数据数据采集采集数据数据标注标注非非结结构构化化数数据据结结构构化化数数据据声音人体事件道路物体车辆图片行为信号科技科技公司公司行业行业企业企业AI公司公司科研科研单位单位下下游游应应用用下游企业下游企业自有团队自有团队对结构化数据的需求催生基础数据服务产业对结构化数据的需求催生基础数据服务产业人工智能基础数据服务白皮书 2023。欲了解更多信息,请联系德勤中国。人工智能技术经历数十载的发展,近年来深度学习加速了人工智能技术的商业化落地,同时也带来了大量AI算法训练需求,推动基础数据服务市场的快速增长信息来源:公开资料整理、IDC;德勤访谈、研究与分析8.210.713.818.030.345.0130-160+41%25%-30%人工智能技术已经经历了较长时间的发展,近年来由深度学习带来的人工智能技术商业化应用落地极大的推动了人工智能技术已经经历了较长时间的发展,近年来由深度学习带来的人工智能技术商业化应用落地极大的推动了AI基础数据服务的需求基础数据服务的需求人工智能发展阶段及重要里程碑人工智能发展阶段及重要里程碑人工智能的人工智能的诞生诞生人工智能技术人工智能技术高速发展高速发展2006-20161950s-2005 1956年达特茅斯会议召开,标志着人工智能这人工智能这一技术的诞生一技术的诞生 1958年感知器:脑的组织和信息存储的概率模型发表,打开了神打开了神经网络研究的大门经网络研究的大门 2006年,深度学习神经深度学习神经网络网络概念被提出 2016年,谷歌Alpha Go运用深度学习算法运用深度学习算法战胜世界围棋冠军,拉开了人工智能深度学习商业化落地的大幕2027E20182019202020212022深度学习加速人工智能商业化落地深度学习加速人工智能商业化落地20172021年百度与小马获得首批自动驾驶车辆收费服务试点,标志着中国自动驾驶商业化运营的元年2017年,苹果iphoneX首次推出人脸识别解锁,2017-2018年,阿里巴巴、小米及百度先后推出AI智能音箱。AI智能终端商业化快速发展中国人工智能基础数据服务市场规模中国人工智能基础数据服务市场规模单位:亿元基础数据服务受基础数据服务受AI商业化落地驱动高速增长商业化落地驱动高速增长人工智能基础数据服务白皮书 2023。欲了解更多信息,请联系德勤中国。数据采集标注类型数据采集标注类型未来增长潜力未来增长潜力未来增速未来增速1自动驾驶自动驾驶采集大量真实、覆盖不同道路天气小概率事件的道路视频图像以及激光点云图像,标注视频图像以及点云数据中的道路可行驶区域、车辆、行人等各类元素自动驾驶行业对数据的需求处于起步阶段,未来技术与功能迭代、场景拓展将带动数据需求量几何级增长数据需求量几何级增长32-37%智慧工业智慧工业采集产品图像、生产环境画面、设备运行状态画面等数据,标注各类生产状况及产品图像及其状态,如钢铁表面瑕疵或裂纹工业视觉是行业增长主要驱动力,伴随国家对工业领域数字化智能化的重投入,未来行业需求量有望放量需求量有望放量提升提升24-29%智能安防智能安防采集各类公共场所、居民住宅楼及商用楼的监控摄像头数据,标注视频图像中的人脸骨骼点、车辆、动作行为等元素人脸识别精确度的可提升空间有限,但事件感知识别等新场景需求为智能安防基础数据服务需求带来一定需求带来一定增长空间增长空间17-22%AI+互联网互联网采集用户生成的文章、搜索、直播、视频、图像等内容素材,标注文本中的敏感字眼以及视频图像中人的行为、手势、嘴型等动作元素行业快速技术迭代驱动数据迭代需求增长,但由于技术路径正向无监督训练倾斜,未来长期看数据标注的未来长期看数据标注的需求量或将先增后减需求量或将先增后减15-20%智慧医疗智慧医疗采集医疗影像、手术工具、处方、设备控制、病例等数据,标注医疗影像中的人体拉框、骨骼点以及处方病例中的文本等我国老龄化明显,医疗行业AI应用发展旺盛,带动基础数据服务需求呈现一定增长需求呈现一定增长15-20%其他其他智能终端:各国人像、小语种、方言等数据智慧金融:票据单据、保险标的、人脸、对话语音等非结构化数据以及风控数据等结构化数据智能终端、智慧金融等场景已较为成熟固化,未来增增长潜力稍低,将趋于稳定长潜力稍低,将趋于稳定但其他潜在应用领域例如元宇宙板块随着发展成熟或存在市场增长爆发的机遇12-16%10%6%10%7%10%7%16%12%16%16%38%52%20222027E注释:1.2022-2027E CAGR信息来源:德勤访谈、研究与分析人工智能基础数据服务应用于众多下游场景,但不同下游场景对数据采集类型以及数据标注对象有着各自的差异化需求,自动驾驶当前是人工智能基础数据服务最重要的应用领域,并将在未来继续维系这一地位人工智能基础数据服务下游应用占比(人工智能基础数据服务下游应用占比(2022-2027E)基础数据服务在不同场景的需求各不相同基础数据服务在不同场景的需求各不相同45亿亿整体市场规模:130-160亿亿份额占比:增加持平降低人工智能基础数据服务白皮书 2023。欲了解更多信息,请联系德勤中国。自动驾驶AI算法的升级迭代及模型训练数据量的指数级增长,将持续拉动人工智能基础数据服务需求信息来源:德勤访谈、研究与分析17.124.638.251.662.474.92024E44%38%2022E2023E50%52%2025E52%2026E52%2027E大量整车厂与Tier1开始自研自动驾驶人工智能算法带来新数据需求,同时搭载自动驾驶车型渗透率不断攀升,算法模型的跨车型搭载带来适配需求自动驾驶技术从目前低级别向高级别的迭代迭代将带来人工智能模型训练数据量指数级指数级的需求增长持续稳定的“小确幸”持续稳定的“小确幸”技术迭代带来的需求“大爆发”技术迭代带来的需求“大爆发”自动驾驶人工智能基础数据服务市场规模及整体占比自动驾驶人工智能基础数据服务市场规模及整体占比单位:亿元;%自动驾驶基础数据服务规模自动驾驶占整体基础数据服务占比预计2025年L3级别自动驾驶级别自动驾驶实现商业化应用,相应的算法达到一定的成熟度,基础数据服务需求开始相对收敛当前自动驾驶领域各参与厂商正持续研发并落地L2+级别自动驾驶级别自动驾驶L4级别自动驾驶级别自动驾驶2030后后或逐步落地,算法模型训练的数据需求2027年后或将逐步释放核心驱动因素核心驱动因素自动驾驶将在未来持续释放数据基础服务需求自动驾驶将在未来持续释放数据基础服务需求人工智能基础数据服务白皮书 2023。欲了解更多信息,请联系德勤中国。目前自动驾驶主要聚焦于L2+级别开发和应用,随着算法趋于成熟,算法开发对于数据的需求量呈周期性收敛趋势,而高级别L3和L4自动驾驶技术场景更为复杂,算法模型训练所需的数据量将逐步呈现指数级上升场景处理复杂程度:低高自动驾驶等级场景及发展规划自动驾驶等级场景及发展规划数据采标数据采标需求需求对应功能对应功能及场景处理及场景处理复杂程度复杂程度量产车量产车落地时间落地时间自动自动驾驶驾驶场景场景发展发展规划规划在限定道路和环境条件下,系统完成所有驾驶操作算法需要针对驾驶过程中的全部算法需要针对驾驶过程中的全部场景实现感知并自动实现驾驶过场景实现感知并自动实现驾驶过程中的全部操作程中的全部操作系统完成所有驾驶操作,根据系统需求,驾驶员适时接管算法需针对驾驶过程中的全部场算法需针对驾驶过程中的全部场景进行有效感知与控制景进行有效感知与控制Level 3L4级别的算法模型开放性较高,最终成熟可能需要百亿甚至千亿帧百亿甚至千亿帧级别级别标注需求一个L3级别算法模型打开了更多的应用场景,最终成熟需要约十亿约十亿帧级别帧级别标注需求一个L2+级别算法模型的最终成熟需要约千万至亿帧级别约千万至亿帧级别标注需求系统通过加速/制动和转向提供持续辅助算法可提供部分场景城市领航、算法可提供部分场景城市领航、记忆泊车等有限功能记忆泊车等有限功能Level 2+信息来源:智能网联汽车技术路线图2.0;德勤访谈、研究与分析预计各类网联式L4车辆将在车辆将在2030年实现商业化年实现商业化落地,落地,鉴于目前已经有部分领先算法公司处于L4算法研发阶段,对于数据的需求将持续释放L3级自动驾驶预计在2025年实现商业化应用,商业化应用,目前各大车企正在积极布局,预计2023年开始将爆发大量模型训练带来的数据需求将爆发大量模型训练带来的数据需求目前已经处于L2+级别自动驾驶规模化量产阶规模化量产阶段,段,除了新进入者及新车型带来的基础数据服务需求外,整体需求呈现收敛态势Level 4Level 4*随着自动驾驶技术迭代,功能和场景复杂度不断提高,每个场景下所需的标注点成倍增长,数据采标需求量呈指数级增长随着自动驾驶技术迭代,功能和场景复杂度不断提高,每个场景下所需的标注点成倍增长,数据采标需求量呈指数级增长数据采标需求:低高自动驾驶将在未来持续释放数据基础服务需求自动驾驶将在未来持续释放数据基础服务需求L2爆发期爆发期20302025202220232027L2收敛期收敛期L3爆发期爆发期L3收敛期收敛期L4爆发期爆发期2020L2爆发期爆发期L3爆发期爆发期L4爆发期爆发期L2收敛期收敛期L3收敛期收敛期人工智能基础数据服务白皮书 2022。欲了解更多信息,请联系德勤中国。人工智能基础数据服务白皮书 2023。欲了解更多信息,请联系德勤中国。信息来源:德勤访谈、研究与分析相似功能应用场景扩展相似功能应用场景扩展外语、方言识别外语、方言识别口罩、墨镜下人脸识别口罩、墨镜下人脸识别安防事件预测安防事件预测算算法法与与功功能能迭迭代代创创新新L3自动驾驶自动驾驶L4自动驾驶自动驾驶L5自动驾驶自动驾驶L2+自动驾驶自动驾驶智慧工业智慧工业智慧城市智慧城市元宇宙元宇宙L2自动驾驶自动驾驶人脸识别人脸识别语音识别语音识别语音合成语音合成人工智能算法仍处于快速动态演进阶段,随着算法与功能的迭代创新,场景功能的持续扩展,数据标注元素和标注信息维度均将大幅增加,对于数据基础服务供应商提出了更高要求成熟应用成熟应用中长期中长期长远未来长远未来短期短期人工智能发展趋势示意图人工智能发展趋势示意图算法迭代算法迭代创新需求创新需求场景功能场景功能扩展需求扩展需求随着不同场景下的功能不断拓展完善,算法存在迭代创新的需求。以自动驾驶领域为例,随着L2至L4自动驾驶技术的迭代发展需要,相应的算法对于功能性要求愈发提高,对于数据采集与标注的需求也将愈发庞大复杂,需要感知训练评测平台加持模型迭代的效率与精确度。利用AI算法,实现对于同一种或者相似度较高的功能(例如人脸识别)需求不断拓展,对算法进行挖掘需求提炼、规则定义、工具制作、数据处理等工作,深度挖掘高价值数据标签。数据基础服务复杂度不断提升数据基础服务复杂度不断提升人工智能基础数据服务白皮书 2023。欲了解更多信息,请联系德勤中国。AI自动标注能力推高行业竞争门槛自动标注能力推高行业竞争门槛随着标注量的增大,纯人工标注在成本上不再具有优势,AI赋能的自动标注能力与相关工具逐渐成为基础数据服务商和AI算法公司降本增效的利器,也推高了行业门槛,未来市场集中度有望提升AI自动标注基于通过大量数据训练的算法模型,能够实现对原始数据中需要标注的元素的自动识别、检测以及标注AI自动标注通过算法模型反哺,基于基础图像识别能力演化而来自动标注通过算法模型反哺,基于基础图像识别能力演化而来借助借助AI自动标注可大幅提升标注效率自动标注可大幅提升标注效率以人工标注为主,标注过程中利用AI能力形成辅助工具帮助实现自动贴边、自动分割等功能,从而提高人工标注效率AI自动标注的不同功能模块自动标注的不同功能模块信息来源:德勤访谈、研究与分析AI自动标注的主要作用自动标注的主要作用标注效率提升标注效率提升使标注更简单高效,帮助提升数据标注速度标注速度标注成本降低标注成本降低提高效率的同时实现人工的部分替代,节省人力成本基础数据服务训练算法的同时算法也能赋能自动标注基础数据服务训练算法的同时算法也能赋能自动标注训练基础数据服务基础数据服务算法模型算法模型赋能AI辅助工具辅助工具AI自动预标注自动预标注通过AI算法初步生成标注结果,AI标注完成后再通过人工进一步核对和验证AI自动标注无法完全替代人工标注自动标注无法完全替代人工标注AI自动标注仍需要人工审核,且复杂度和精细度较高的需求仍然依赖人工标标注注任任务务随着人工智能算法功能的不断迭代演进,自动标注需要随着人工智能算法功能的不断迭代演进,自动标注需要持续的训练以及更强的算法能力支撑,行业门槛提高,持续的训练以及更强的算法能力支撑,行业门槛提高,具备较强法能力和稳定训练资源的数据基础服务供应商具备较强法能力和稳定训练资源的数据基础服务供应商以及算法公司将更具优势以及算法公司将更具优势自动化程度:较低自动化程度:较低自动化程度:较高自动化程度:较高AI自动标注自动标注人工审核人工审核人工标注人工标注人工审核人工审核AI赋值标注赋值标注人工审核人工审核定制化需求自动化程度:高低人工智能基础数据服务白皮书 2023。欲了解更多信息,请联系德勤中国。基础型服务基础型服务随着人工智能技术应用深化,下游AI算法应用方自研人工智能算法的趋势逐渐显现,他们相对算法公司而言,更需要“基础数据服务+云资源+工具链”的全栈式服务信息来源:德勤访谈、研究与分析下游应用厂商向上游布局趋势显著下游应用厂商向上游布局趋势显著新格局下的全栈式服务需求新格局下的全栈式服务需求传统算法公司对于基础数据服务的需求聚焦于标注效率、标注标注效率、标注质量以及标注成本质量以及标注成本等基础型需求算法应用方对于数据存储以及算法开发和运行所依赖的云计算云计算算力资源算力资源提出了相应的新需求需借助数据管理中台、智能标注平台、感知训练平台、仿真平台等成熟的算法工具成熟的算法工具链产品链产品实现快速部署与持续的快速迭代目前工具链主要应用在自动驾驶领域,未来需求将随着人工智能商业化场景的成熟扩展至各行各业 随着下游应用方的下场参与,他们算法能力积累较少,而同时面临算法能力快速部署与迭代的需求,进而催生出了对包括云资源、算法工具链等全栈式工具服务的需求进而催生出了对包括云资源、算法工具链等全栈式工具服务的需求云计算资源云计算资源算法工具链算法工具链 人工智能技术应用的逐渐深化促使部分下游人工智能应用厂商在产业链上进行延伸,逐步开始向上游人工智能算法领域布局算法公司与应用方都有对全栈式服务的需求,云计算资源及算法工具链需求量不断扩大。但相比之下应用方的技术能力偏弱,在向上游延伸的过程中,对于工具链的需求更加强烈 2018年,上汽宣布建立人工智能实验室上汽ai lab,大举进入自动驾驶领域,加大算法研发投入 2015年海康威视成立人工智能研究院 2017年大华成立聚焦AI等技术的先进技术研究院 2016年,招商银行正式提出要加快推进金融科技战略,通过旗下招银网络科技加人工智能的创新应用智能安防智能安防自动驾驶自动驾驶智慧金融智慧金融全栈式服务需求逐渐显现全栈式服务需求逐渐显现主要需求方主要需求方:算法公司+算法应用方示例示例人工智能基础数据服务白皮书 2023。欲了解更多信息,请联系德勤中国。数据采集数据采集数据标注数据标注自动驾驶算法研发自动驾驶算法研发自动驾驶解决方案开发自动驾驶解决方案开发自动驾驶整车应用自动驾驶整车应用标注工具标注工具标注团队标注团队传统车企传统车企造车新势力造车新势力整整车车厂厂Tier 1企业企业(如博世、大陆等)(如博世、大陆等)自动驾驶算法公司自动驾驶算法公司信息来源:德勤访谈、研究与分析基础数据服务商基础数据服务商自动驾驶板块表现十分明显,算法研发过去由专业算法公司把控,近年来越来越多的整车厂与头部Tier1也开始构建自有算法,尝试掌握自动驾驶的核心环节,由此成为行业的“算法新兵”基础数据服务商专注于服务下游客户外包数据服务需求传统车企核心布局自动驾驶整车应用Tier1厂商主要通过整合自动驾驶软硬件集成解决方案领先公司的工具能力更强头部传统Tier1逐渐加入自研自动驾驶算法以把控算法为目的,头部整车厂陆续搭建算法自研团队多自建一定规模数据标注团队及标注供给满足自身部分需求传统车企与传统传统车企与传统Tier1近年近年来纷纷布局自研算法来纷纷布局自研算法核心布局环节延伸布局环节仅吉利亿咖通具备甲级测绘资质造车新势力自带互联网基因,且相较传统车企,技术路径更先进,技术投入更高,往往倾向采用自研算法路径,并亲自布局自动驾驶算法至整车应用的完整环节自动驾驶算法公司核心布局算法环节自动驾驶算法成为“兵家必争之地”自动驾驶算法成为“兵家必争之地”“算法新兵”主要采用“算法新兵”主要采用外部标注工具与外部标外部标注工具与外部标注团队进行算法自研注团队进行算法自研有部分内生核心团队,同时外包部分需求人工智能基础数据服务白皮书 2023。欲了解更多信息,请联系德勤中国。内生处理内生处理外包需求外包需求中小中小算法算法公司公司头部头部算法算法公司公司专专业业自自动动驾驾驶驶算算法法公公司司“算法新兵”将在未来释放出大量基础数据服务需求的外包需求,同时随着整车厂及Tier1供应商对于自动驾驶算法自主研发能力的深化,也将释放更多工具链使用需求信息来源:德勤访谈、研究与分析传统车企传统车企造车造车新势力新势力整整车车厂厂Tier1自动驾驶基础数据服务不同下游客户数据处理需求量占比示意图自动驾驶基础数据服务不同下游客户数据处理需求量占比示意图当前第三方基础数据服务商市场空间当前第三方基础数据服务商市场空间“算法新兵”释放全栈式需求“算法新兵”释放全栈式需求数据需求向整车厂及数据需求向整车厂及Tier1侧重侧重随着整车厂及Tier1供应商对于自动驾驶算法自主研发能力的深化,将产生更多的基础数据服务需求,占比逐步提升外包服务需求整体加强外包服务需求整体加强随着当前的L2+继续向L3和L4的技术迭代,更多复杂场景下的复杂标注需求将更多通过外包的形式得到满足,数据基础服务供应商的专业性将协助其进行市场开拓工具链需求逐渐显现工具链需求逐渐显现由于工具链对于算法开发在算力、协同性、易用性等方面不可替代的优势,未来随着传统车企与Tier1随着算法能力构建深入,工具链将成为未来企业的主要工具12210%100%数数据据需需求求量量占占比比基础数据服务外包占比基础数据服务外包占比未来变化趋势未来变化趋势30%3人工智能基础数据服务白皮书 2023。欲了解更多信息,请联系德勤中国。随着数据安全相关法律法规体系的完善,数据合规要求愈发严格,基础数据服务商在数据脱敏处理、数据采集的测绘资质要求等环节的专业性价值优势凸显信息来源:民法典、信息安全技术个人信息安全规范 、中华人民共和国数据安全法、自然资源部关于促进智能网联汽车发展维护测绘地理信息安全的通知;德勤访谈、研究与分析311920202021 2021年7月,国家有关主管部门对国内企业高精度地图测绘资质进行复核,具有甲级测资质的企业由原来的31家减少到现在的19家,资质获取难度较高,具有稀缺性202020212022数据合规相关法律法规及标准体系数据合规相关法律法规及标准体系自动驾驶领域响应政策,甲级测绘资质成为数据采集必须自动驾驶领域响应政策,甲级测绘资质成为数据采集必须数据脱敏合规性数据授权合规性 因涉及数据安全性与保密性,自然资源部规定仅已获得甲级测绘资质的企业可合法开展自动仅已获得甲级测绘资质的企业可合法开展自动驾驶高精度地图的数据采集、存储、传输与处驾驶高精度地图的数据采集、存储、传输与处理等相关测绘活动理等相关测绘活动,而无相关测绘资质的企业须与有资质企业合作以达成合规要求导航电子地图制作甲级测绘资质审核要求高,目前具备该资质的厂商共导航电子地图制作甲级测绘资质审核要求高,目前具备该资质的厂商共19个个规定个人信息控制者开展个人信息处理活动应向个人信息主体明示个人信息处理目的、方式、范围等规则,征征求其授权同意求其授权同意针对个人信息去标识化与匿名化提出更为严格的定义,明确经处理后的信息不仅不得识别到特定自然明确经处理后的信息不仅不得识别到特定自然人人,而且不得关联到相关个人信息主体规定任何以电子或者其他方式记录的信息的处理,包括数据的收集、存储、试用、加工、传输、提供、公开收集、存储、试用、加工、传输、提供、公开等,均应进行规范以保障数据安全,工业、电信、交通、金融、科技等行业主管部门承担本行业、本领域数据安全监管职责中华人民共和国数据安全法中华人民共和国数据安全法2021.6 信息安全技术个人信息安全规范信息安全技术个人信息安全规范 2020.3对于各行各业的数据安全与合规提出了更严格的顶层设计对于各行各业的数据安全与合规提出了更严格的顶层设计自然资源部关于促自然资源部关于促进智能网联汽车发展进智能网联汽车发展维护测绘地理信息安维护测绘地理信息安全的通知全的通知2022.8数据合规趋严,专业性价值凸显数据合规趋严,专业性价值凸显中超联赛2020年商业价值年度报告 2021。欲了解更多信息,请联系德勤中国。人工智能基础数据服务白皮书 2023。欲了解更多信息,请联系德勤中国。科技巨头下场,行业竞争格局正在重塑科技巨头下场,行业竞争格局正在重塑人工智能基础数据服务行业有三类参与企业:以百度为代表的科技巨头,核心优势在于资源整合和研发能力;以数据堂为代表的专业型服务商,众包或人力外包模式起家;以曼孚科技为代表的科创公司,基于算法研发能力,以自动标注等标注工具切入市场。从市场份额看,百度位居行业第一,市占率达到17-18%信息来源:德勤访谈、研究与分析类型类型代表企业代表企业核心能力核心能力未来份额趋势未来份额趋势科技巨头公司科技巨头公司强大的IT能力带来的算法工具链能力AI大模型算法基础带来一定的自动化标注能力云计算资源的部署与协同能力全平台业务带来的客户资源专业型基专业型基础数据服础数据服务商务商品牌化专业服务商以众包或重人力外包模式起步,依托多年服务经验形成了各环节专业化的基础数据服务能力;能够覆盖多行业多场景基础数据服务需求部分成熟应用场景下通过经验积累已经具备一定的标准化数据集产品能力以及较为成熟的工具链能力中小型人力外包企业缺乏技术能力,仅通过众包及人力外包模式,提供低成本的人力标注服务科技初创企业科技初创企业通过算法研发,以自动化标注及AI标注工具切入市场,从而降低标注人力成本,尝试以低成本获取竞争份额50%-55%30%-35%15%-20%基础数据服务整体格局(基础数据服务整体格局(2022)人工智能基础数据服务商市场份额占比及核心能力分析人工智能基础数据服务商市场份额占比及核心能力分析以山东、山西、河南、贵州等地为主,人力资源充沛,人力成本较低,具有大量数据基础服务人力外包企业百度智能云百度智能云数据众包数据众包阿里众包阿里众包京东众智京东众智腾讯数据厨房腾讯数据厨房数据堂数据堂海天瑞声海天瑞声澳鹏澳鹏龙猫龙猫数据数据MindFlowStardustBodenAISurfingTech人工智能基础数据服务白皮书 2023。欲了解更多信息,请联系德勤中国。顺应标注复杂化、标注自动化、全栈式服务化以及数据合规化的“四化”趋势,科技巨头依托长期的技术和资源积累,综合能力更强,竞争优势突出百度智能云数据众包百度智能云数据众包阿里众包阿里众包京东众智京东众智澳鹏澳鹏海天瑞声海天瑞声数据堂数据堂强大的AI算法能力支撑其自动标注以及场景筛选等辅助标注能力自动标注算法能力较强,主要部署在云端,一般通过打包云服务方式销售具备一定的AI预标注能力,但整体AI算法能力相对百度和阿里稍弱缺乏强AI大模型能力支撑,但基于海外市场20余年行业经验,具备一定的AI自动化标注能力缺乏强算法能力支撑,自动标注能力较弱,但基于自有标注平台的研发与迭代,在语音、基础图像领域针对相对成熟的应用、具备一定的AI辅助标注能力拥有自动驾驶甲级测绘资质集团内拥有自动驾驶甲级测绘资质不具备甲级测绘资质,但也都高度注重数据合规性及数据安全背靠百度,强大的产研团队定制标注工具,对算法行业理解深刻全面的法务合规团队与政府合作共建大规模、稳定的数据标注基地对互联网行业具备深刻的数据需求理解主要采取灵活的众包和人力外包模式,暂无自建标注团队对互联网行业具备深刻的数据需求理解千人规模的自建标注团队可保障交付质量具有多年专业化基础数据服务经验,具备较强的服务响应能力拥有无锡与大连两处自建标注中心团队,具备一定规模的内部交付团队语音领域具有深厚资源,能够提供标注数据集产品具备专业化标注基地,承接业务种类丰富基于百度AI基础数据服务能力、云资源、算法能力提供强大的全栈式服务能力拥有相对完善工具链产品,在自动驾驶行业积累丰富,帮助企业自建自研能够提供基于阿里云的包括云资源、工具链等功能集成的全栈式服务云资源相对稍弱,全栈式服务能力不及百度和阿里缺乏大型科技企业技术能力资源背书,主要专注于数据采集标注服务,全栈式服务能力弱,但具备一定的工具能力,可以协助客户进行数据标注工具的开发自动化自动化标注能力标注能力专业化基础数专业化基础数据服务能力据服务能力全栈式全栈式服务能力服务能力信息来源:德勤访谈、研究与分析顺应行业“四化”趋势,头部企业竞争优势愈加明显顺应行业“四化”趋势,头部企业竞争优势愈加明显专业资质及专业资质及合规性合规性人工智能基础数据服务白皮书 2023。欲了解更多信息,请联系德勤中国。百度数据众包拥有行业最大的自建标注团队,同时依托百度深耕人工智能多年的行业理解与经验,实现了数据标注能力与全流程业务能力的相互反哺,构建数据闭环信息来源:公司官网、公开资料整理;德勤访谈、研究与分析标杆案例:百度数据众包标杆案例:百度数据众包 2-3万稳定签约标注人员 百度数据众包在山东济南、山西临汾、重庆奉节、四川达州、甘肃酒泉、江西新余等10个地区有自建标注基地,可全力保障数据标注服务的全力保障数据标注服务的高质量交付高质量交付山东江西山西甘肃四川人员人员规模规模 图像框选100万框/天 图像分割8000帧/天 点云框选70万框/天标注标注能力能力 为基地标注人员提供综合标注技能培训 具有完善的人员考核机制和标注质检流程质量质量保障保障 AI数据处理具有高并发的需求特征,另外随着算法迭代升级和场景功能的拓展,稳定的自建标注基地带来的专业性将得以凸显稳定的自建标注基地带来的专业性将得以凸显,为高效、高质量处理客户需求提供保障庞大的自建标注团队为数据服务能力提供强力保障庞大的自建标注团队为数据服务能力提供强力保障百度强大的数据标注能力与全流程业务能力助力实现数据闭环百度强大的数据标注能力与全流程业务能力助力实现数据闭环数据标注数据标注能力能力全流程业务全流程业务能力能力基于领先的数据标注经验与平台技术积累,为AI研发与落地提供完善的基础数据提供完善的基础数据服务与私有化数据标注平台服务与私有化数据标注平台,通过科学的管理流程、自动化的标注工具、全面的数据安全与数据合规策略,帮客户在企业内部快速完成数据标注目标在人工智能商业化场景加速落地的当下,打通数据采集、传输/存储、处理挖掘、标注,以及基于数据的模型训练、仿真训练、模型优化和部署升级的数据基础服务全流数据基础服务全流程程,是数据基础服务行业高效推进业务流程的关键必备能力持续提升反哺强化不断强化的数据闭环正循环不断强化的数据闭环正循环数据闭环数据闭环人工智能基础数据服务白皮书 2023。欲了解更多信息,请联系德勤中国。百度数据众包依托自身较强的技术能力及规模化的专业标注团队,形成了强大的基础数据全栈式服务能力,提供数据管理、智能标注、感知训练评测、仿真测试服务的全面赋能,即可提供整套解决方案也可解耦使用信息来源:公司官网;德勤访谈、研究与分析百度强大的资源及能力支- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 人工智能 基础 数据 服务 白皮书
咨信网温馨提示:
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【宇***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【宇***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【宇***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【宇***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
关于本文