2022中国大数据分析行业研究报告.pdf
《2022中国大数据分析行业研究报告.pdf》由会员分享,可在线阅读,更多相关《2022中国大数据分析行业研究报告.pdf(57页珍藏版)》请在咨信网上搜索。
1、 中国大数据分析行业研究报告|中国大数据分析 行业研究报告 中国大数据网 2022 年 4 月 中国大数据分析行业研究报告|目录 1 研究背景.1 2 大数据产品概念和分类.3 2.1 大数据发展的驱动力.4 2.2 大数据产品分类.7 2.2.1 大数据基础设施.8 2.2.2 大数据分析.10 2.2.3 大数据应用.19 2.2.4 大数据开源项目.20 2.2.5 数据源和数据资源.22 2.3 大数据分析的价值.22 3 大数据分析市场规模和发展趋势.24 3.1 大数据分析市场规模.24 3.2 大数据分析市场趋势.25 3.2.1 国产化产品蓬勃发展.26 3.2.2 云化部署持
2、续增长,公有云、非公有云部署同步发展.26 3.2.3 大数据分析平民化.26 3.3 大数据分析技术趋势.27 3.3.1 增强分析步入人工智能阶段.27 3.3.2 湖仓一体成为新的数据基础设施底座.29 3.3.3 流批一体将两种架构模式融为一体.30 4 大数据分析三大细分市场主要厂商分析.31 4.1 商业智能和数据可视化.33 4.2 流批一体.39 4.3 智能运维.45 5 结论.51 6 研究机构简介.52 中国大数据分析行业研究报告|图表目录 图表 1、全球生成、获取、复制、消费的数据量(单位 ZB),Statista 2022.3 图表 2、大数据产品分类.7 图表 3、
3、传统编程与机器学习模型对比.13 图表 4、批量计算与流式计算对比.16 图表 5、指标平台架构(来源:Benn Stancil).17 图表 6、典型的大数据行业应用.20 图表 7、开源大数据项目.22 图表 8、中国大数据市场支出预测 2021v2(来源:IDC).24 图表 9、中国大数据软件市场支出分布(来源:中国大数据网).25 图表 10、增强分析的演进(来源:Gartner).28 图表 11、数据仓库、数据湖、湖仓一体架构对比(来源:).29 图表 12、批量分析与流式分析(来源:flink.apache.org).30 图表 13、大数据分析市场厂商类型.32 图表 14、
4、大数据分析市场主要厂商.33 图表 15、商业智能和数据可视化市场主要厂商.34 图表 16、新兴型行业智能化和数据可视化厂商 2020 年相对市场份额(主营业务收入口径).34 图表 17、新兴型行业智能化和数据可视化厂商综合科技创新能力评价.35 图表 18、中国商业智能软件市场规模(来源:IDC).35 图表 19、中国商业智能和数据可视化软件市场厂商份额(来源:IDC).36 图表 20、帆软的商业智能产品.37 图表 21、微软的 Power Platform.38 图表 22、流批一体市场主要厂商.39 图表 23、新兴型流批一体厂商 2020 年相对市场份额分布(主营业务收入口径
5、).40 图表 24、新兴型行业流批一体化厂商综合科技创新能力评价.40 图表 25、广义流批一体的三个板块.41 图表 26、阿里的流批一体架构.42 图表 27、滴普科技 FastData 的实时湖仓引擎.43 图表 28、Kyligence 的流批一体解决方案.44 图表 29、智能运维市场主要厂商.46 图表 30、新兴型智能运维厂商 2020 年相对市场份额分布(主营业务收入口径).46 图表 31、新兴型智能运维厂商综合科技创新能力评价.47 图表 32、Splunk 智能运维平台.47 图表 33、新炬网络的全栈一体化智能运维平台.48 图表 34、博睿数据智能运维监控产品.49
6、 图表 35、基调听云智能运维产品.49 图表 36、擎创科技智能运维平台.50 中国大数据分析行业研究报告|1 1 研究背景 在全球信息化快速发展的大背景下,大数据已成为国家重要的基础性战略资源,正引领新一轮科技创新,推动经济转型发展。紧密围绕数据资源开展的基础设施建设、数据集聚整合、数据分析处理、数据开放共享和数据安全,铸就了大数据产业发展的核心要素。这些要素所构筑的“内层齿轮”的转动直接带动了“外层齿轮”大数据融合应用的蓬勃发展,衍生出政府大数据、互联网大数据、健康医疗大数据、金融大数据、电信大数据和工业大数据等热点场景,持续驱动经济增长和转型升级。“十三五”时期,我国大数据产业快速起步
7、。据测算,产业规模年均复合增长率超过 30%,2020 年超过 1 万亿元,发展取得显著成效,逐渐成为支撑我国经济社会发展的优势产业。政策体系逐步完善。党中央、国务院围绕数字经济、数据要素市场、国家一体化大数据中心布局等做出一系列战略部署,建立促进大数据发展部际联席会议制度。有关部委出台了 20 余份大数据政策文件,各地方出台了 300 余项相关政策,23 个省区市、14 个计划单列市和副省级城市设立了大数据管理机构,央地协同、区域联动的大数据发展推进体系逐步形成。产业基础日益巩固。数据资源极大丰富,总量位居全球前列。产业创新日渐活跃,成为全球第二大相关专利受理国,专利受理总数全球占比近 20
8、%。基础设施不断夯实,建成全球规模最大的光纤网络和 中国大数据分析行业研究报告|2 4G 网络,5G 终端连接数超过 2 亿,位居世界第一。标准体系逐步完善,33 项国家标准立项,24 项发布。产业链初步形成。围绕“数据资源、基础硬件、通用软件、行业应用、安全保障”的大数据产品和服务体系初步形成,全国遴选出 338个大数据优秀产品和解决方案,以及 400 个大数据典型试点示范。行业融合逐步深入,大数据应用从互联网、金融、电信等数据资源基础较好的领域逐步向智能制造、数字社会、数字政府等领域拓展,并在疫情防控和复工复产中发挥了关键支撑作用。生态体系持续优化。区域集聚成效显著,建设了 8 个国家大数
9、据综合试验区和 11 个大数据领域国家新型工业化产业示范基地。一批大数据龙头企业快速崛起,初步形成了大企业引领、中小企业协同、创新企业不断涌现的发展格局。产业支撑能力不断提升,咨询服务、评估测试等服务保障体系基本建立。数字营商环境持续优化,电子政务在线服务指数跃升至全球第 9 位,进入世界领先梯队。中国大数据产业发展受宏观政策环境、技术进步与升级、数字应用普及渗透等众多利好因素的影响,市场需求和相关技术进步成为大数据产业持续高速增长的最主要动力。中国大数据产业呈现集成创新和泛在赋能的新趋势。新一轮科技革命蓬勃发展,大数据与 5G、云计算、人工智能、区块链等新技术加速融合,重塑技术架构、产品形态
10、和服务模式,推动经济社会的全面创新。各行业各领域数字化进程不断加快,基于大数据的管理和决策模式日益成熟,为产业提质降本增效、政府治理体系和治理能力现代化广泛赋能。随着“互联网+”的 中国大数据分析行业研究报告|3 不断深入推进以及数字技术的不断成熟,大数据的应用和服务持续深化,中国大数据产业将继续保持高速增长,创新力强、附加值高、自主可控的现代化大数据产业体系将基本形成,持续促进传统产业转型升级,激发经济增长活力,助力新型智慧城市和数字经济建设。2 大数据产品概念和分类 大数据是数据的集合,以容量大、类型多、速度快、精度准、价值高为主要特征,是推动经济转型发展的新动力。图表 1、全球生成、获取
11、、复制、消费的数据量(单位 ZB),Statista 2022 大数据应用的蓬勃发展是社会进步的必然结果,互联网普及之后,数据的生成、获取、复制、消费呈现出指数级发展的趋势,这些数据来自气象卫星、交通摄像头、车联网、电力/能源/工业/环保行业的数控设备和传感器、社交媒体动态、音频视频消费习惯、移动应用的 中国大数据分析行业研究报告|4 用户使用行为、购物平台的浏览和购买记录、服务器的事务记录及安全日志等等,企业和政府利用这些数据制定决策,完善流程和政策,并打造以用户为中心的产品、服务和体验。通过挖掘和分析这些数据,企业能够提高自身的竞争力和抗风险能力,把握新机遇,革新业务模式;政府能够洞察趋势
12、、制定出更科学的决策和政策。在现代社会环境下,不进行大数据分析,就会“耳聋眼瞎”。2.1 大数据发展的驱动力 大数据在业务需求和技术创新的结合中蓬勃发展。许多以大数据为核心战略的公司取得了巨大的成功,阿里巴巴、腾讯、亚马逊、苹果都是大家耳熟能详的例子。大数据的迅速发展有六个主要的驱动因素:社会数字化、物联网、技术成本快速下降、云计算的快速发展、数据科学的普及、人工智能的崛起。1.1.社会数字化社会数字化 消费者驱动和面向消费者的大数据是最重要的大数据应用,“永远在线”的消费者生产了大量的数据。据 2021 年 2 月中国互联网络信息中心(CNNIC)发布的 中国互联网络发展状况统计报告,中国有
13、 9.9 亿网民,平均每天的上网时间为 3.7 小时。网民与网民之间、网民与企业之间、网民与政府之间的每一次交互,每次点击、滑动或处理消息,都会在各大平台的数据库中创建新数据,巨大的人口基数创建出了巨量的数据。新冠肺炎疫情加速推动了从个体、企业到政府全方位的社会数字 中国大数据分析行业研究报告|5 化转型浪潮。疫情的隔离使个体更加倾向于使用互联网连接,用户上网意愿、上网习惯加速形成。网民个体利用流媒体平台和社交平台获取信息,借助网络购物、网上外卖解决日常生活所需,通过在线政务应用和健康码办事出行,不断共享互联网带来的数字红利。在企业方面,疫情的出现为企业数字化转型按下了“加速键”,在线办公、在
14、线交易等线上化运营方式为企业在特殊时期保持正常运转提供了支撑。在政府方面,政府的数字化应急能力和在线政务服务能力在疫情下不断“淬炼”,在线服务指数由全球第 34 位跃升至第 9 位,迈入全球领先行列。2 2、物联网、物联网 物联网(IoT)是指通过传感设备、按照标准通讯协议,把物品与互联网连接,实现智能化服务的网络。物联网大致诞生于 2008 年到 2009 年,互联网上连接的物的数量超过了人的数量时,物联网诞生了。工业、商业和公共设施领域很早就开始了物联网应用,智能汽车市场也开始爆发,一辆普通家用轿车上大约有近百个传感器,而且传感器数量还在不断增长之中,更有大量的智能设备开始走入家庭,家庭里
15、的 IP 地址数量急剧增长。据 Business Insider,IoT Analytics,Gartner,Intel,Statista 联合预测,2025 年全球将有309 亿设备接入物联网。这些物联网设备能够以更高的速率不知疲倦地生产数据,对这些设备的运营、监控以及安全保障,离不开大数据技术的支撑,反过来也推动了大数据技术的进步。3 3.技术成本技术成本快速快速下降下降 中国大数据分析行业研究报告|6 大数据相关的技术变得越来越便宜,数据存储和处理的成本不断下降,使小型企业甚至个人都能够参与大数据应用。摩尔定律在大数据领域适用,计算能力的性价比每两年翻番,存储密度以及容量也每两年翻一番。
16、相较于世纪之初的 2000 年,在造价相同的情况下,现在我们可以获得超过 1000 倍的计算性能和超过 1000 倍的存储容量。除了计算和存储成本的下降之外,影响大数据系统成本的另一个关键因素是开源大数据软件。与价格高昂的数据仓库时代相比,这些开源软件以及基于开源软件快速成长、扩散的技术服务能力,极大地降低了大数据项目的成本。4 4.云计算的云计算的快速发展快速发展 云计算以及云计算环境下大数据技术的成熟,使构建一套大数据系统从高投入、高风险的项目(需要大量专家长时间进行系统搭建),变为低门槛、快速启动的项目(基础软件可以在若干分钟之内搭建完成),而且能够随着业务的增长进行无缝的技术增长,只需
17、为实际使用的计算和存储资源付费。云计算大幅降低了大数据系统的技术门槛、时间成本和使用成本。5 5.数据科学的普及数据科学的普及 新世纪以来,数据科学和数据科学家这两个词变得非常流行。哈佛商业评论称数据科学家为“二十一世纪最性感的工作”。近年的职场上,对数据科学家和类似职位的需求急剧增加,许多人积极投身到数据科学领域。对数据科学的教育更加专业化,统计和数据分析专业,正在变为学生和工作人群中的热门专业。数据科学的普及为大数 中国大数据分析行业研究报告|7 据的发展贮备好了智力资源。6 6.人工智能的崛起人工智能的崛起 大数据发展的早期阶段,具有数据科学知识是进入大数据行业的基本门槛。进入 2020
18、 年代,随着人工智能带来的革命性变化,数据分析的技术门槛已经大大降低,大量未经数据科学训练的业务人员也可以方便地使用大数据系统了,实现了数据分析“平民化”的效果,大大促进了大数据技术的应用深度和广度。2.2 大数据产品分类 图表 2、大数据产品分类 大数据市场经过 20 多年的长足发展,形成了丰富的市场生态,从产品、服务供应端的视角大致可分为如下领域:大数据基础设施、存储Hadoop数据湖数据仓库湖仓一体流式/内存数据库关系型数据库NoSQL数据库NewSQL数据库实时数据库图数据库MPP数据库ETL/数据转换反向ETL数据集成数据治理/访问隐私/安全数据可观察性数据质量管理/监控无服务器集群
19、服务大数据基础设施商业智能平台数据可视化数据分析师平台增强分析数据目录与发现指标平台流批一体化日志分析查询引擎搜索大数据分析销售客户体验/服务企业市场营销消费市场营销人力资本法律合规财务自动化和RPA安全广告互联网房地产政府与情报电信金融投资金融借贷保险卫生健康生命科学交通农业工业教育大数据应用框架数据格式查询/数据流数据访问数据库编排基础设施数据运营流与消息统计工具和语言AI/机器学习 ML运营/基础设施搜索日志与监控可视化协同安全大数据开源项目数据市场和发现财经数据天空海数据人员/实体数据位置智能数据源和API数据服务孵化器与学校研究机构数据资源 中国大数据分析行业研究报告|8 大数据分析
20、、大数据应用、大数据开源项目、数据源和 API、数据资源。下面我们对各个领域择要讨论,并对数据分析相关部分着重展开。2.2.1 大数据基础设施 大数据技术的高速发展期开始于本世纪初,其前身是数据库技术。随着数据规模持续的高速增长,主流的技术覆盖范围从“数据”变成了“大数据”,其基础技术的演化大致有如下脉络:1、数据库 2、数据仓库 3、数据湖 4、湖仓一体 这些技术彼此之间并没有淘汰或取代的关系,他们各自有自己的定位和擅长的业务场景,共同构成了大数据时代的技术基础设施。数据仓库是个诞生于数据库时代的概念,早期服务于超大型企业的决策支持,并且也在不断地与时俱进,云上数据仓库服务获得了更多的大中小
21、型客户,是对结构化数据进行分析的大数据技术。数据湖源自于大数据时代开源技术体系的开放设计,经过云计算服务商的积极推广,在新兴公司中大量被采用。通常是由一系列云产品或开源组件共同构成大数据解决方案,可以处理一系列格式不同的结构化、半结构化、非结构化数据。数据仓库和数据湖是大数据架构的两种设计取向,两者在设计的根本分歧点是存储系统访问、权限管理、建模要求等方面的不同。中国大数据分析行业研究报告|9 数据湖和数据仓库作为大数据系统的两条不同演进路线,有各自特有的优势和局限性。数据湖对初创用户友好但成长性不佳,而数据仓库则刚好反之,对初创用户不友好但成长性较好。历史较长的用户一般都成长于数据库时代,数
22、据仓库(如果有建设需求的话)是当时唯一的选择。进入互联网时代,云上的半结构化、非结构化数据越来越多,也需要进行处理的时候,传统的数据仓库就遇到挑战。相当一部分新型企业(尤其是新兴的创业公司)从零开始架构的大数据技术栈,正是伴随开源大数据软件的流行,天然地选择了数据湖架构。随着业务的不断发展,数据湖架构的问题开始显现,它太过灵活而缺少对数据监管、控制和必要的治理手段,导致运维成本不断增加、数据治理效率降低,企业落入了“数据沼泽”的境地,即数据湖中汇聚了太多的数据,反而很难高效率的提炼真正有价值的那部分。湖仓一体的架构应运而生,兼顾数据湖的灵活性和数据仓库的成长性/事务性。湖仓一体的实现路径有两种
23、。第一种,在数据仓库上支持数据湖,一般方案是在数仓中建外部表;第二种,在数据湖中支持数仓能力,一般方案是做一些开发,比如多版本并发控制、自适应schema、提供文件级事务等等。两种实现路径都需要解决一些共性问题,如数据打通问题、元数据一致性问题、湖和仓上不同引擎之间数据交叉引用的问题、湖仓开发工具缺乏问题等等。湖仓一体的架构是新一代大数据分析的基础设施。中国大数据分析行业研究报告|10 2.2.2 大数据分析 大数据分析领域有商业智能平台、可视化、数据分析师平台、增强分析、数据目录与发现、指标平台、流批一体、日志分析、查询引擎、搜索等细分领域。2.2.2.1 商业智能 商业智能(BI,Busi
24、ness Intelligence)是大数据分析最典型应用领域,指以大数据基础设施系统为基础,运用各种数据分析手段进行数据分析以实现商业价值,部分商业智能的输出结果会以可视化的方式展现。商业智能不是严格意义上的一种技术,它是数据库、数据仓库、数据湖、湖仓一体、ETL、OLAP、数据挖掘、机器学习和人工智能、资料展现等技术的综合运用,把它视为一套配合业务的流程和解决方案更为合适。商业智能的关键是从许多来自不同的数据源中提取出有用的资料并进行清理,以保证资料的正确性,然后经过抽取(Extraction)、转换(Transformation)和装载(Load),即 ETL 过程,合并到数据仓库里,从
25、而得到企业资料的一个全局视图,在此基础上利用合适的查询和分析工具、数据捕捞工具、OLAP 工具、机器学习和人工智能技术等对其进行分析和处理(这时信息变为辅助决策的知识),最后将知识呈现给管理者,为管理者的决策过程提供支持。人工智能在商业智能里开始扮演越来越重要的作用。中国大数据分析行业研究报告|11 2.2.2.2 数据可视化 数据可视化把抽象的数据以人类容易理解的形式进行展现,常见的展现形式包括:图形图像处理、计算机视觉以及用户界面,通过表达、建模以及对立体、表面、属性和动画的显示。数据可视化可以大幅度提高人们对数据涵义的沟通效率。2.2.2.3 数据分析师平台 数据分析师通常来自业务领域(
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022 中国 数据 分析 行业 研究 报告
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【Stan****Shan】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【Stan****Shan】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。