2020年中国AI基础数据服务行业研究报告.pdf
《2020年中国AI基础数据服务行业研究报告.pdf》由会员分享,可在线阅读,更多相关《2020年中国AI基础数据服务行业研究报告.pdf(24页珍藏版)》请在咨信网上搜索。
1、中国AI基础数据服务行业发展报告2020年22020.3 iResearch I摘要来源:艾瑞根据公开资料自主研究绘制。中小型数据供应商的整体体量仍然可观,但随着业务门槛提升、客户需求多样化,越来越多的“中小型数据供应商”在苦恼生存问题,该群体在未来1-2年内将迎来一阵“倒闭潮”。4“品牌数据服务商”在这1-2年内应该“居安思危”,注重品牌认可度塑造、提高规模化生产能力、大力发展如预标注、项目进度可视化等精细化运营方式、增加如语音合成(TTS)数据处理等差异化服务,最终追求的是单位价格的利润最大化。5目前人工智能商业化在算力、算法和技术方面基本达到阶段性成熟,想要更加落地,解决行业具体痛点,需
2、要大量经过标注处理的相关数据做算法训练支撑,可以说数据决定了AI的落地程度。12019年中国AI基础数据服务行业市场规模可达30.9亿元,预计2025年市场规模将突破100亿元,年化增长率为21.8%。3对比中国与世界的发展情形来看,人工智能行业发展前景良好,而作为强关联性的AI基础数据服务行业受其发展红利的影响,未来市场仍有不小的上升空间。SMS23中国及全球人工智能发展概览1人工智能基础数据服务市场现状2人工智能基础数据服务行业壁垒3行业发展机遇与挑战442020.3 iResearch I人工智能产业发展和产业链结构数据决定了AI落地程度,是商业化过程中重要的一环自从2012年深度学习在
3、图像和语音方面产生重大突破后,人工智能便真正具备了走出实验室步入市场的能力,2016年AlphaGo的胜利再次引爆行业,成功唤起了中国市场的兴趣,时至今日,人工智能的商业化在中国得到了长足发展,在安防、金融、企服等领域纷纷落地开花,同时也真正意义上衍生出了一套完整的产业链。AI产业链可以分为基础层、技术层和应用层,基础层按照算力、数据和算法再次划分,对整体上层建筑起到支撑作用;技术层根据算法用途分为计算机视觉、智能语音、自然语言处理等,是AI最引人注目的环节;应用层则按照不同场景的需求定制开发专属服务,是AI真正赋能行业的方式。目前人工智能商业化在算力、算法和技术方面基本达到阶段性成熟,想要更
4、加落地,解决行业具体痛点,需要大量经过标注处理的相关数据做算法训练支撑,可以说数据决定了AI的落地程度,而AI基础数据服务行业又鲜有关注,因此本报告承接艾瑞2019年中国人工智能基础数据服务白皮书,再次挖掘该行业的现状和发展,展示其真实的一面。来源:艾瑞根据公开资料自主研究绘制。实现途径算力传统通用计算(CPU)AI计算架构AI芯片CPU+GPUTPUFPGA智能设备视觉类脑自动驾驶安防物联网支持系统计算平台硬件设备云服务储存设施网络传输数据采集知识图谱编程语言算法平台AI框架量子计算理论研究基础层应用层技术层数据数据存储数据处理数据挖掘信息抽取数据标注数据采集数据清洗算法机器学习算法监督式学
5、习非监督学习半监督学习强化学习深度学习迁移学习早期算法搜索式推理专家系统智能代理计算机视觉图像识别人脸识别视频识别文字识别视觉识别步态识别智能语音声音识别语音合成语音交互声纹识别自然语言处理信息理解机器翻译自然语言生成文字校对人工智能产业链结构52020.3 iResearch I人工智能技术实现路径机器学习是主流,其中监督学习下的深度学习是主要方式人工智能是对一类能够实现机器模拟智慧生命某些特征的技术统称,从学术上可以分为以知识工程为代表的符号主义、以神经网络为代表的连接主义和以仿生机器人为代表的行为主义三个流派,近些年掀起又一轮人工智能热潮的机器学习就属于连接主义学派。机器学习按照训练方式
6、可分为使用人工标注分类标签训练的监督学习、无分类标签且自动聚类推断的无监督学习、使用少量人工标注+自动聚类的半监督学习和根据现实情况自动“试错+调整”的强化学习四类,而最著名的深度学习同样是机器学习的分支,但因为模型结构的不同而与上述训练方式不在一个区分范畴,深度学习在训练方式上均可与四种方式发生重叠。目前来看AI应用最广泛的计算机视觉和智能语音更依赖于监督学习下的深度学习方式,半监督和无监督是学术界尝试突破的方向,当下仅在如无人驾驶中急转弯场景训练等特定领域中得以尝试应用,而强化学习被认为是更接近人类在自然界中学习知识的方式,在最佳路径选择、最优解探寻等方面有所应用,但泛化能力还有待突破。来
7、源:艾瑞根据公开资料自主研究绘制。机器学习划分和主要训练路径训练数据特征提取训练模型输出模型模型验证分类标签新数据特征提取预测分类标签特征矩阵特征向量训练预测监督学习无监督学习半监督学习强化学习深度学习机器学习主要划分方式训练数据深度学习模型分类标签输出模型训练预测新数据深度学习模型分类标签监督学习训练路径深度学习训练路径62020.3 iResearch I人工智能对数据资源服务的需求趋势定制化需求成为主流,数据服务市场步入需求常态化监督学习下的深度学习算法训练十分依赖人工标注数据,2012年-2016年期间人工智能行业不断优化算法增加深度神经网络层级,利用大量的数据集训练提高算法精准性,I
8、mageNet开源的1400多万张训练图片和1000余种分类在其中起到重要作用,为了继续提高精准度,保持算法优越性,市场中产生了大量的标注数据需求,这也催生了AI基础数据服务行业的诞生。时至今日,人工智能从业公司的算法模型经过多年的打磨,基本达到阶段性成熟,随着AI行业商业化发展,更具有前瞻性的数据集产品和高定制化数据服务需求成为了主流。据了解,目前一个新研发的计算机视觉算法需要上万张到数十万张不等的标注图片训练,新功能的开发需要近万张图片训练,而定期优化算法也有上千张图片的需求,一个用于智慧城市的算法应用,每年都有数十万张图片的稳定需求;语音方面,头部公司累计应用的标注数据集已达百万小时以上
9、,每年需求仍以20%-30%的增速上升,不仅如此,随着IoT设备的普及,语音交互场景越来越丰富,每年都有更多的新增场景和新需求方出现,对于标注数据的需求也是逐步增长。结合市场来看,随着AI商业化发展,AI基础数据服务需求步入常态化,存量市场具有较为稳定的需求源头,而增量市场随着应用场景的丰富,以及新型算法的诞生,拥有更广阔的想象空间。来源:艾瑞根据公开资料自主研究绘制。前瞻性数据集产品定制服务稳步增长需求变化D A I L Y人工智能算法模型基本达到阶段性成熟,随着AI落地行业的趋势,更具有前瞻性的数据集产品和高定制化数据服务需求成为了主流存量市场增量市场Y E A R L Y结合计算机视觉和
10、语音市场的需求情况看,AI基础数据服务需求成为常态,主要需求方稳定,数据需求量保持稳步增长随着AI落地传统行业,以及IoT设备的普及,人工智能的应用场景越来越丰富,需求方类型也在逐年增加,具有广阔的想象空间空间广阔人工智能对数据资源服务的需求趋势72020.3 iResearch I全球人工智能产业发展情况全球市场火热依旧,呈现集群式发展,AI落地仍是主旋律2019年全球人工智能行业发展依旧火热,重点围绕北美、欧洲和亚洲三大区域发展,共有5386家活跃企业,27400名高级研究人员,20座重点发展城市,产生了约374亿美元融资,其中自动驾驶、药物医疗、人脸识别、视频内容和金融反欺诈是获得融资最
11、多的领域。综合来看,美国仍然是人工智能领域的领头羊,每年不仅向全球输出最前沿的AI应用概念,提供最接近市场需求的应用场景,同时也吸收着世界各地不断涌入的人才、数据资源和创意灵感。以英国、德国为代表的欧洲发展区和以中国、日本、新加坡、印度为代表的亚洲发展区整体实力相近,但走出了两条完全不同的路径,虽然欧洲储备了大量的AI人才,但市场活性不强,对于创新业务的发展并不友好,而亚洲虽然人才储备不充裕,但市场活力十足,对AI技术充满了期待。来源:艾瑞根据公开资料自主研究绘制。注释:图中超级独角兽指估值100亿美元及以上AI企业旧金山湾区达拉斯蒙特利尔波士顿纽约多伦多都柏林伦敦巴黎阿姆斯特丹柏林斯德哥尔摩
12、特拉维夫新加坡深圳北京上海东京悉尼北美活跃AI企业:2472家AI人才:13458人AI重要政策:8个融资:128亿美元超级独角兽企业:78家方向:数据库、医疗、时尚和零售、文本分析、聊天机器人、自动驾驶、金融风控洛杉矶欧洲活跃AI企业:1149家AI人才:5086人AI重要政策:9个融资:46亿美元超级独角兽企业:8家方向:时尚和零售、医疗、文本分析、广告营销、自动驾驶、金融风控亚洲活跃AI企业:1667家AI人才:1850人AI重要政策:13个融资:200亿美元超级独角兽企业:8家方向:智能制造、人脸识别、教育、自动驾驶、医疗健康金融风控2019年全球人工智能发展特征82020.3 iRe
13、search I中国与全球人工智能发展情况对比中国AI发展属世界前列,并仍处于上升期,前景良好全球人工智能发展了六十年,中国参与了二十余年,随着政府意志和市场意志双重聚焦,中国的人工智能发展进入了黄金期。对比2019年中国与全球人工智能发展情况,在AI相关论文发布数量、企业数量、融资总额、产业规模、专利申请数量等方面中国均居世界头部阵营,具有充分的市机场竞争力。补足短板方面,中国也在不断努力。人才储备是技术软实力发展的核心,教育问题并非能一蹴而就地解决,目前全国已经有35所高等院校开设了AI专业,国际交流和国际人才引进也在不断加深,未来5年内将有大量从业者涌入市场。产业结构单一也是中国人工智能
14、行业存在的固有问题,研发型企业远少于应用型企业的隐患随着中美专利竞争而浮现,政府开始重视AI基础层创业公司的培养,资本方也更加关注AI芯片、机器学习算法、数据处理等产业链上游企业的发展,科技巨头企业更是提前进行了AI生态布局,建立了产业联盟,在各方的努力中中国AI市场处于从局部向整体发展的上升期,行业前景良好。来源:艾瑞根据公开资料自主研究绘制。注释:FWCI是标准化后的论文影响力,计算的是对象论文的被引用次数和相同学科、相同年份、相同类型论文平均被引次数的比值,当FWCI1时,代表论文质量达到或超过了世界平均水平,设定世界均数为1中国2019期间AI相关论文发布数量为全球第一,FWCI引用指
15、数为0.8,上涨明显;AI人才储备方面综合排名全球第7,仍有很大发展空间;中国AI相关企业数量和活跃企业数量均居世界第二,仅次于美国;2019年AI相关融资中,中国融资总额为166亿美元;相关市场规模方面中国2019年预计规模为570亿人民币,占据世界头部阵营;2008-2019年AI相关专利申请共发生448684项,中国有66508项,位居世界第二。论文数AI论文占全部论文的3%人才数/高级人才数博士22000名/专家5400名活跃企业数5386家融资总额约374亿美元相关产业规模数千亿人民币2008-2019年专利数448684项论文数/FWCI引用均数 占全球AI论文28%/FWCI为0
16、.8人才数/高级人才数博士413名/专家120名活跃企业数1189家融资总额约166亿美元相关产业规模约570亿人民币2008-2019年专利数66508项2019年中国与全球人工智能发展情况对比92020.3 iResearch I2020.3 iResearch I中国人工智能典型产业规模近几年,人工智能技术在实体经济中寻找落地应用场景成为核心要义,人工智能技术与传统行业经营模式及业务流程产生实质性融合,智能经济时代的全新产业版图初步显现,预计2019年人工智能核心产业规模将突破570亿元,目前,安防和金融领域市场份额最大,工业、医疗、教育等领域具有爆发潜力。来源:艾瑞根据专家访谈自主研究
17、绘制。来源:艾瑞根据对不同行业市场规模的研究,进行统计建模而得。2018-2022年中国人工智能赋能实体经济市场规模2019年AI赋能实体经济预计贡献收入超570亿元2019年中国人工智能赋能实体经济各产业份额251.1570.1819.81157.01573.020182019e2020e2021e2022e人工智能赋能实体经济所产生的市场规模(亿元)53.8%15.8%11.6%4.2%4.0%3.6%3.4%2.4%0.8%0.4%AI+安防AI+金融AI+营销AI+交通AI+客服AI+零售AI+制造AI+教育AI+农业AI+医疗102020.3 iResearch I2020.3 iR
18、esearch I中国科技企业人工智能算法研发投入2019年中国科技企业AI算法研发投入规模预计超370亿元根据数据分析,2019年中国科技企业技术研发投入约为4005亿元,其中人工智能算法研发投入占比为9.3%,超370亿元,且大部分投入来自互联网科技公司。主要AI算法应用领域计算机视觉、语音识别/语音合成,以及自然语言处理占比分别为22.5%、2.3%和7.1%,三者中计算机视觉相关算法研发投入占比最大,这与视觉相关创业公司数量、产业需求和政策导向呈正相关联系,计算机视觉目前仍是中国最具代表性的AI应用技术。来源:艾瑞通过对代表互联网科技公司、AI创业公司,以及相关传统企业的专家访谈自主研
19、究绘制。来源:艾瑞通过对上述企业相关专家访谈,以及2019年中国AI从业者分布情况研究绘制。2019年中国科技企业AI算法研发投入情况2019年中国科技企业AI主要领域算法研发投入情况计算机视觉类语音识别/语音合成类自然语言处理类其他(如知识图谱、数据科学、机器学习等)占比 22.5%占比 2.3%占比 7.1%2019年中国科技企业技术研发投入(亿元)2019年中国科技企业AI算法研发投入(亿元)4005约为371亿元,占比9.3%64%的研发投入来自互联网科技公司11中国及全球人工智能发展概览1人工智能基础数据服务市场现状2人工智能基础数据服务行业壁垒3行业发展机遇与挑战4122020.3
20、 iResearch I2020.3 iResearch I25.9 30.9 36.3 42.8 50.7 61.4 76.7 101.1 19.6%17.5%17.8%18.5%21.1%24.8%31.8%201820192020e 2021e 2022e 2023e 2024e 2025e2019年AI基础数据服务市场规模(亿元)整体市场增速中国人工智能基础数据服务市场规模2025年市场规模将突破100亿元,年化增长率为21.8%艾瑞通过对中国AI基础数据服务行业中主要需求方、品牌数据服务商、主要中小型数据供应商等多方调研描绘市场情况,根据数据显示,2019年中国AI基础数据服务行业市
21、场规模可达30.9亿元,其中图像类、语音类、NLP类数据需求规模占比分别为49.7%、39.1%和11.2%;根据需求方投入情况和供应方营收增长情况推算,预计2025年市场规模将突破100亿元,年化增长率为21.8%,该行业核心业务与当下以监督学习为主的人工智能市场具有强相关联系,市场发展前景向好。来源:艾瑞通过对包括互联网科技公司与人工智能公司在内的十几家数据主要需求方代表,和品牌数据服务公司与中小型数据供应商等十几家主要数据供应商调研,统计分析数据而得。来源:艾瑞根据专家访谈自主研究绘制。2019-2025年中国AI基础数据服务行业市场规模2019年中国AI基础数据服务行业市场规模中各类型
22、数据占比49.7%39.1%11.2%图像类数据需求占比(%)语音类数据需求占比(%)NLP类数据需求占比(%)132020.3 iResearch I20192020e2021e2022e2023e2024e2025e增量市场增速整体市场增速存量市场增速从需求方角度看市场增速整体增速平稳向上,增量市场将替代存量市场成为主要拉力AI基础数据服务市场从需求角度看可以分为存量市场和增量市场,存量市场中巨头互联网科技公司和AI创业公司为主要需求方,项目落地所需要的采集、标注数据逐渐成为需求核心,存量市场仍是目前AI基础数据服务市场的需求主体;增量市场是相对于存量市场而存在的,以海外市场、国内新需求方
23、市场、国内新兴业务拓展和国内新成立的AI创业公司需求为主,增量市场虽然近些年对于整体市场规模的贡献率不够明显,但随着中国人工智能技术的不断深入与国际化,在未来将成为主要的拉动力量。从短期来看,AI基础数据服务市场增速仍然与存量市场增速紧密相关,主要依赖于已有客户常规业务委托,以及如语音识别业务中方言、小语种数据需求增加等内容更新需求支撑发展,随着存量市场需求逐渐长尾化,供应方将会更加关注增量市场的拓展,来减轻对已有客群的依赖,达到良性的可持续发展。来源:艾瑞根据专家访谈自主研究绘制。注释:文中存量市场指数据资源服务行业已有并且稳定的业务范畴,如人脸识别、车辆识别、图片识别、语音识别等相关业务;
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2020 年中 AI 基础 数据 服务行业 研究 报告
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【宇***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【宇***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。