2019年中国计算机视觉行业市场研究.pdf
《2019年中国计算机视觉行业市场研究.pdf》由会员分享,可在线阅读,更多相关《2019年中国计算机视觉行业市场研究.pdf(36页珍藏版)》请在咨信网上搜索。
1、1 报告编码19RI0796 头豹研究院|计算机系列深度研究400-072-5588 2019 年 中国计算机视觉行业市场研究 报告摘要TMT 团队 根据国家标准化管理委员会指导编撰的2018 人工智能标准化白皮书定义,计算机视觉是使用计算机模仿人类视觉系统的科学,让计算机拥有类似人类提取、处理、理解和分析图像以及图像序列的能力。自动驾驶、机器人、智能医疗等领域均需要通过计算机视觉技术从视觉信号中提取并处理信息。随着移动设备数量的增长和传感器技术的进步,包含有价值的图像和视频数据的增加,智能终端与移动设备采集和产生的环境与用户数据成为宝贵资源。对视觉信息的分析须借助计算机视觉技术,数据量的急剧
2、增长,算力的大幅提升和深度学习算法的不断优化极大促进了计算机视觉行业的发展。热点一:深度学习算法促进计算机视觉准确度提升热点二:海量数据为深度学习算法提供了大量数据热点三:人工智能芯片发展提供算力支持基础 算法是计算机视觉行业发展的核心要素之一,是计算机基于其所训练的数据集归纳出的识别逻辑,算法模型的优化可以更精准的识别物体和场景。由学术及研究机构承担建设的公共数据集不断丰富,公共数据集一般用于算法测试和能力竞赛,具有高质量特点,为技术提高提供优质数据,为计算机视觉创业企业带来优质资源。计算机视觉领域的图像和视频数据需要大量矩阵计算操作,传统的 CPU 算力不足,无法满足并行计算要求。随着 G
3、PU、FPGA,ASIC 等专用芯片的出现,数据处理速度大幅提升,为计算机视觉发展提供算力支持。GPU、FPGA、ASIC 等具有良好并行计算能力的芯片性能高,算力在CPU数十倍甚至上百倍之上,可大幅缩短计算过程,有利于缩短模型架构调整时间,加快模型进步速度。詹欣琪 邮箱: 分析师 行业走势图 相关热点报告 计算机系列深度研究2020 年中国低代码开发平台行业概览 计算机系列深度研究行业概览_2019 年中国办公软件行业概览 1 报告编码19RI0401 目录 1方法论.41.1方法论.41.2名词解释.52中国计算机视觉行业市场综述.92.1计算机视觉行业定义.92.2计算机视觉行业分类.9
4、2.3中国计算机视觉行业规模.122.4计算机视觉行业产业链.132.4.1产业链上游.132.4.2产业链中游.162.4.3产业链下游.163中国计算机视觉行业驱动因素.183.1深度学习算法促进计算机视觉准确度提升.183.2海量数据为深度学习算法提供了大量的数据支持.193.3人工智能芯片发展提供算力支持.203.4计算机视觉应用前景广阔.204中国计算机视觉行业制约因素.224.1中国计算机视觉实际商业应用能力仍需提高.222 报告编码19RI0401 4.2高质量数据获取成本高、难度大.225中国计算机视觉行业相关政策法规.246中国计算机视觉行业发展趋势.266.1计算从云端到智
5、能前端.266.2云+AI,智能云端赋能前端实现计算机视觉.277中国计算机视觉行业竞争格局.297.1中国计算机视觉行业竞争格局概览.297.2中国计算机视觉行业典型企业分析.297.2.1依图科技.297.2.2云从科技.317.2.3格灵深瞳.32 3 报告编码19RI0401 图表目录 图 2-1 中国计算机视觉行业规模,2014-2023 年预测.12图 2-2 计算机视觉行业产业链.13图 2-3 视频图像采集设备芯片.15图 2-4 计算机视觉应用领域.17图 3-1 计算机视觉相关数据集.19图 3-2 计算机视觉部分应用领域.21图 4-1 数据、算法、商业应用产品作用机制.
6、23图 5-1 人工智能与计算机视觉相关政策.25图 7-1 格灵深瞳智能算法技术.33图 7-2 格灵深瞳产品.34 4 报告编码19RI0401 1 方法论 1.1 方法论 头豹研究院布局中国市场,深入研究 10 大行业,54 个垂直行业的市场变化,已经积累了近 50 万行业研究样本,完成近 10,000 多个独立的研究咨询项目。研究院依托中国活跃的经济环境,从人工智能、人脸识别、机器视觉等领域着手,研究内容覆盖整个行业的发展周期,伴随着行业中企业的创立,发展,扩张,到企业走向上市及上市后的成熟期,研究院的各行业研究员探索和评估行业中多变的产业模式,企业的商业模式和运营模式,以专业的视野解
7、读行业的沿革。研究院融合传统与新型的研究方法,采用自主研发的算法,结合行业交叉的大数据,以多元化的调研方法,挖掘定量数据背后的逻辑,分析定性内容背后的观点,客观和真实地阐述行业的现状,前瞻性地预测行业未来的发展趋势,在研究院的每一份研究报告中,完整地呈现行业的过去,现在和未来。研究院秉承匠心研究,砥砺前行的宗旨,从战略的角度分析行业,从执行的层面阅读行业,为每一个行业的报告阅读者提供值得品鉴的研究报告。头豹研究院本次研究于 2019 年 06 月完成。5 报告编码19RI0401 1.2 名词解释 ILSVRC:ImageNet Large Scale Visual Recognition C
8、hallenge,图像分类领域的比赛。petaflop/s-day(pfs-day):一天之内进行每秒一千万亿次的浮点运算。人工智能:研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新兴技术科学。计算机视觉:使用计算机及相关设备模拟人类视觉认知和理解事物的计算机技术。OCR 技术:Optical Character Recognition,光学字符文本识别技术,计算机通过光学设备检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程,完成计算机对文字的阅读。语音识别:让机器通过识别和理解过程把语音信号转变为相应的文本或命令的计
9、算机技术。自然语言处理:实现人与计算机之间用自然语言进行有效通信的计算机技术。深度学习:深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。嵌入式系统:一种完全嵌入受控器件内部,为特定应用而设计的专用计算机系统。开源软件:Open Source Software(OSS),公开源代码的软件。神经网络的反向传播算法(BP 算法):学习过程由信号的正向传播与误差的反向传播两个过程组成。支撑向量机(SVM):在机器学习领域,是一个有监督的学习模型,通常用来进行模式识别、分类以及回归分析。CPU:Central Pr
10、ocessing Unit,中央处理器,是一块超大规模的集成电路,是一台计 6 报告编码19RI0401 算机的运算核心和控制核心。它的功能主要是解释计算机指令以及处理计算机软件中的数据。GPU:Graphics Processing Unit,图形处理器,又称显示核心、视觉处理器、显示芯片,是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上进行图像运算工作的微处理器。ASIC 芯片:Application Specific Integrated Circuit,用于供专门应用的集成电路芯片技术。FPGA:Field-Programmable Gate Array,
11、现场可编程门阵列,专用集成电路(ASIC)领域中的一种半定制电路。TFLOP/S:T/s,是数据流量的计数单位,即 1 万亿次浮点指令每秒,是衡量一个电脑计算能力的标准。CCD:Charge-coupled Device,电荷耦合器件。CMOS:Complementary Metal Oxide Semiconductor,互补金属氧化物半导体。DSP:Digital Signal Processing,数字信号处理。DVR:Digital Video Recorder,硬盘录像机(即数字视频录像机),是一套进行图像计算存储处理的计算机系统,具有对图像/语音和动态帧等进行长时间录像、录音、远程
12、监视和控制的功能。DVS:Digital Video Server,网络视频服务器,是一种压缩、处理音视频数据的专业网络传输设备。H.265 编码:视频编码标准,可在低于 1.5Mbps 的传输带宽下,实现 1080p 全高清视频传输。IPC:网络摄像机,由网络编码模块和模拟摄像机组合而成。网络编码模块将模拟摄像 7 报告编码19RI0401 机采集到的模拟视频信号编码压缩成数字信号,可直接接入网络交换及路由设备。IP-SAN:以 IP 网络构建存储网络,较光纤通道,具有更经济、自由扩展等特点。ISP:Image Signal Processing,图像信号处理。主要用来对前端图像传感器输出信
13、号处理的单元,以匹配不同厂商的图象传感器。NVR:Network Video Recorder,网络硬盘录像机。最主要的功能是通过网络接收 IPC(网络摄像机)设备传输的数字视频码流,并进行存储、管理,从而实现网络化带来的分布式架构优势。SoC 芯片:一种集成电路的芯片,可有效地降低电子/信息系统产品的开发成本。存储介质:存储数据的载体,如硬盘、闪存、U 盘、等。高级别容错性:软件检测应用程序所运行的软件或硬件中发生的错误并从错误中恢复的能力。Caffe:Convolutional Architecture for Fast Feature Embedding,一种常用的深度学习框架,在视频、
14、图像处理方面应用较多。Theano:一种深度学习 Python 算法库。Torch:一种深度学习框架。MXNet:一种深度学习库,为多 GPU 配置提供了良好的配置。TensorFlow:谷歌研发的第二代人工智能学习系统。PaddlePaddle:百度旗下深度学习开源平台。CNTK:微软出品的开源深度学习工具包。API:Application Programming Interface,应用程序编程接口,本质是预先定义的函数和算法,目的是供应用程序与开发人员调用特定技术功能。SDK:Software Development Kit,软件开发工具包,是被软件工程师用于为特定的 8 报告编码19R
15、I0401 软件包、软件框架、硬件平台、操作系统等建立应用软件时的开发工具的集合。ZB:Zettabyte,泽字节,一种信息计量单位,通常在标示网络硬盘总容量或具有大容量的存储介质之存储容量时使用。9 报告编码19RI0401 2 中国计算机视觉行业市场综述 2.1 计算机视觉行业定义 根据国家标准化管理委员会指导编撰的2018 人工智能标准化白皮书定义,计算机视觉是使用计算机模仿人类视觉系统的科学,让计算机拥有类似人类提取、处理、理解和分析图像以及图像序列的能力。自动驾驶、机器人、智能医疗等领域均需要通过计算机视觉技术从视觉信号中提取并处理信息。计算机视觉技术包括三个过程:目标检测、目标识别
16、和行为识别。目标检测解决从背景中找出使用者关注物体的问题,该环节去除了背景中与目标无关的信息。目标检测技术关键在于动态复杂场景中背景模型的建立、保持与更新。目标识别过程通过多维度的特征分析比对确定物体的定义及分类。行为识别是一种高层次的识别技术,需要对动态多帧图像数据进行理解,并构建相应动作行为模型进行比对。2.2 计算机视觉行业分类(1)2018 人工智能标准化白皮书根据计算机视觉解决的问题将其分为计算成像学、图像理解、三维视觉、动态视觉和视频编解码五大类。计算成像学是探索人眼结构、相机成像原理以及其延伸应用的科学。在相机成像原理方面,计算成像学不断促进现有可见光相机的完善,使得现代相机更加
17、轻便,可适用于不同场景。同时计算成像学也推动着新型相机的产生,使相机超出可见光的限制。在相机应用科学方面,计算成像学可以提升相机的能力,从而通过后续的算法处理使得在受限条件下拍摄的图像更加完善,例如图像去噪、去模糊、暗光增强、去雾霾等,以及实现新的功能,例如全景图、软件虚化、超分辨率等。10 报告编码19RI0401 图像理解是通过用计算机系统解释图像,实现类似人类视觉系统理解外部世界的一门科学。通常根据理解信息的抽象程度可分为三个层次:浅层理解,包括图像边缘、图像特征点、纹理元素等;中层理解,包括物体边界、区域与平面等;高层理解,根据需要抽取的高层语义信息,可大致分为识别、检测、分割、姿态估
18、计、图像文字说明等。目前高层图像理解算法已逐渐广泛应用于人工智能系统,如刷脸支付、智慧安防、图像搜索等。三维视觉即研究如何通过视觉获取三维信息(三维重建)以及如何理解所获取的三维信息的科学。三维重建可以根据重建的信息来源,分为单目图像重建、多目图像重建和深度图像重建等。三维信息理解,即使用三维信息辅助图像理解或者直接理解三维信息。三维信息理解可分为,浅层:角点、边缘、法向量等;中层:平面、立方体等;高层:物体检测、识别、分割等。三维视觉技术可以广泛应用于机器人、无人驾驶、智慧工厂、虚拟/增强现实等方向。动态视觉即分析视频或图像序列,模拟人处理时序图像的科学。通常动态视觉问题可定义为寻找图像元素
19、,如像素、区域、物体在时序上的对应,以及提取其语义信息的问题。动态视觉研究被广泛应用在视频分析以及人机交互等方面。视频编解码指通过特定的压缩技术,将视频流进行压缩。视频流传输中最为重要的编解码标准有国际电联的 H.261、H.263、H.264、H.265、M-JPEG 和 MPEG 系列标准。视频压缩编码主要分为两大类:无损压缩和有损压缩。无损压缩指使用压缩后的数据进行重构时,重构后的数据与原来的数据完全相同,例如磁盘文件的压缩。有损压缩也称为不可逆编码,指使用压缩后的数据进行重构时,重构后的数据与原来的数据有差异,但不会影响人们对原始资料所表达的信息产生误解。有损压缩的应用范围广泛,例如视
20、频会议、可视电话、视频广播、视频监控等。11 报告编码19RI0401(2)从技术应用看,计算机视觉包括人脸识别、机器识别、物体和场景识别、OCR(光学字符文本)识别等技术。人脸识别作为一种身份鉴定的识别技术,包括图像采集、检测定位、特征提取、模型对比等步骤,应用场景广泛。人脸识别的非接触性和非强制性特征使其在各类场景中得以广泛应用。广泛应用于金融领域的身份验证,零售环节的面部识别支付,商业服务领域的自动识别客户等方面。OCR 技术(Optical Character Recognition),即光学字符文本识别技术,计算机通过光学设备检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用
21、字符识别方法将形状翻译成计算机文字的过程。OCR 技术可以高效的将各类印刷体的文件批量自动识别录入计算机,应用于对非结构化数据信息的采集。OCR 技术要经历扫描、版面分析、文字识别、版面还原等过程。OCR 技术主要应用于身份证件识别、单据识别等场景。物体和场景识别是计算机将采集影像与数据库资料进行比对后,识别物体与场景的技术。物体和场景识别技术可应用于军事、医疗、无人驾驶、工业、商业等领域。动态视频识别技术是基于动态图像进行识别,动态视频识别与人脸识别、物体和场景识别具有应用领域交叉。动态视频识别流程如下:利用前端摄像头设备收集和传输数据,运用通过大数据训练、具备云计算能力的深度学习图像分析系
22、统进行视频识别与分析,实时进行视频检测和数据分析。动态视频识别技术主要应用领域有:监控系统:车牌识别、疑犯追踪、车辆违章检测等;行为识别:恐怖分子检测、黄暴视频筛查、动作识别、情绪识别等;电商营销:广告植入、用户画像分析等。姿态识别通过对成像设备中获取的人体图像进行检测、识别和跟踪,对人体行为进 12 报告编码19RI0401 行理解和描述。姿态识别让机器“察言观色”,带来全新人机交互体验。在视觉人机交互方面,姿态识别是人类形体语言交流的一种延伸。从用户体验的角度来说,融合姿态识别的人机交互能产品可大幅提升人机交流的自然性。姿态识别在计算机游戏、机器人控制和家用电器控制等方面具有广阔的应用前景
23、。2.3 中国计算机视觉行业规模 数据、算力和算法是计算机视觉行业发展的三大核心。随着移动设备数量的增长和传感器技术的进步,包含有价值的图像和视频数据的增加,智能终端与移动设备采集和产生的环境与用户数据成为宝贵资源。对视觉信息的分析须借助计算机视觉技术,数据量的急剧增长,算力的大幅提升和深度学习算法的不断优化极大促进了计算机视觉行业的发展。中国计算机行业规模从 2014 年的 11.1 亿元增长至 82.7 亿元,年均复合增长率达 65.2%。伴随计算机视觉技术从传统图片处理方法转向人工智能处理,图像识别准确率显著突破,应用场景不断拓展,计算机视觉行业将进入快速发展阶段,预测 2018 年至
24、2023 年中国计算机视觉行业规模年均复合增长率将达 48.8%,2023 年规模达 603.5 亿元。图 2-1 中国计算机视觉行业规模,2014-2023 年预测 来源:头豹研究院编辑整理 13 报告编码19RI0401 2.4 计算机视觉行业产业链 计算机视觉行业拥有完整产业链,上中下游均处于快速发展阶段。计算机视觉行业上游为支持基础层,包括芯片、传感器、摄像头等硬件、算法支持以及数据支持;中游为计算机视觉技术产品与服务方案提供商,下游为各行业应用领域。图 2-2 计算机视觉行业产业链 来源:头豹研究院编辑整理 2.4.1 产业链上游 计算机视觉上游包括算法、数据集以及芯片、摄像设备、传
25、感器等硬件。当前中国企业在计算机视觉算法领域领先,人工智能芯片仍需依赖海外芯片大厂(如英伟达、英特尔等),摄像机芯片已实现国产化替代。(1)摄像设备 摄像设备产品主要包括前端摄像机(模拟摄像机和网络摄像机)、中心控制端的控制和显示设备、后端的存储录像设备(DVR、NVR、CVR 等)以及各传输环节的光端机和交换机等。摄像设备头部企业海康威视和大华股份在市场领先。(2)传感器 智能传感器为具有信息处理功能的传感器,其具备微处理机,可采集、处理、交换信息等,是传感器集成化与微处理机相结合的产物。计算机视觉通过智能传感器全面感知外界环 14 报告编码19RI0401 境,而不同应用场景(如安防、金融
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2019 年中 国计 视觉 行业 市场 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【宇***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【宇***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。