数据价值化与数据要素市场发展报告(2021年).pdf
《数据价值化与数据要素市场发展报告(2021年).pdf》由会员分享,可在线阅读,更多相关《数据价值化与数据要素市场发展报告(2021年).pdf(52页珍藏版)》请在咨信网上搜索。
1、数据价值化与数据要素市场数据价值化与数据要素市场发展报告发展报告(2021 年)年)中国信息通信研究院政策与经济研究所中国信息通信研究院政策与经济研究所2022021 1 年年 5 5 月月前言前言习近平总书记指出,要“发挥数据的基础资源作用和创新引擎作用”,党的十九届四中全会首次明确数据可作为生产要素按贡献参与分配,关于新时代加快完善社会主义市场经济体制的意见首次将数据与技术、人才、土地、资本等要素一起纳入改革范畴,关于构建更加完善的要素市场化配置体制机制的意见、十九届五中全会等历次重要会议、文件都将数据要素作为重要内容,为加快数据要素市场发展提供了根本遵循、确定了目标、指明了方向。历史经验
2、表明,每一次经济形态的重大变革,必然催生也必须依赖新的生产要素。如同农业经济时代以劳动力和土地、工业经济时代以资本和技术为新的生产要素一样,数字经济时代,数据成为新的关键生产要素。由网络所承载的数据、由数据所萃取的信息、由信息所升华的知识,正在成为企业经营决策的新驱动、商品服务贸易的新内容、社会全面治理的新手段,带来了新的价值增值。加快推进数据价值化、发展数据要素市场是数字经济的关键。数据价值化与数据要素市场发展报告建立了数据价值化的“三化”框架,即数据资源化、数据资产化、数据资本化。全球数据的井喷式生产为数据资源化奠定了基础,本报告重点分析数据资源化中的产业发展规律,其中,数据采集、数据标注
3、有望成为撬动产业规模发展的新引擎。数据资产化是数据通过市场流通交易给使用者或所有者带来经济利益的过程,目前全球对数据权属的确定、数据资产的定价均有一定的探索,数据交易初具规模。以金融衍生产品理论为研究支撑,重点探讨数据资本化中的数据信贷融资及数据证券化,拥有多样化金融工具的数据证券化发展前景广阔。数据资产化是数据要素市场发展的关键与核心。目前,数据要素市场正在形成包含数据交易主体、数据交易手段、数据交易中介、数据交易监管的“四位一体”发展格局,但仍面临数据确权、数据定价等难点。报告从经济学视角出发,提出数据确权及定价的可操作模型,在数据确权的“三分原则”基础上建立了数据确权路径图,基于数据要素
4、特征基础上,建立了从不完全市场到成熟市场数据定价模型。针对数据价值化与数据要素市场发展过程中的关键问题、重难点问题,本报告提出解决方案。为推动数据要素流转,深化数据价值,做大做强数字经济提出政策建议。目录目录一、数据价值化与数据要素市场的概念内涵.1(一)数据价值化概念内涵.1(二)数据要素市场概念内涵.2二、数据价值化的现状和进展.3(一)数据资源化方兴未艾.3(二)数据资产化加速推进.11(三)数据资本化点状探索.19三、加快数据要素市场建设.21(一)“四位一体”的数据要素市场格局.21(二)数据确权“三分原则”及路径实施.29(三)成熟数据要素市场的“四因素定价模型”.38四、数据价值
5、化与数据要素市场发展建议.41(一)完善数据要素资源体系.41(二)构建数据要素市场体系.42(三)壮大数据要素应用体系.44(四)建成数据要素安全体系.45图 目 录图 目 录图 1数据资源化框架图.4图 2全球每年产生数据量及增速图.5图 3头部数据标注企业概况图.9图 4数据标注头部企业基地/工厂区域分布.11图 5基于区块链技术的数据交易流通体系.24图 6数据权利束.31图 7数据确权路径图.38表 目 录表 目 录表 1国内外部分数据交易平台/交易所的定价策略.17表 220172019 年全球最大的五个数据市场.18表 3数据需求主体及类型.22表 4国内数据交易中心.26表 5
6、省市级大数据管理局.28表 6部分大数据交易所数据交易规则.29表 7分类分级数据产权内容.36数据价值化与数据要素市场发展报告(2021 年)1一、数据价值化与数据要素市场的概念内涵我们认为:数据是对客观事物(如事实、事件、事物、过程或思想)的数字化记录或描述,是无序的、未经加工处理的原始素材。数据可以是连续的值,比如声音、图像,也可以是离散的,如符号、文字。数据资源是能够参与社会生产经营活动、可以为使用者或所有者带来经济效益、以电子方式记录的数据。区别数据与数据资源的依据主要在于数据是否具有使用价值。数据要素是参与到社会生产经营活动、为使用者或所有者带来经济效益、以电子方式记录的数据资源。
7、区别数据资源与数据要素的依据主要在于其是否产生了经济效益。(一)数据价值化概念内涵(一)数据价值化概念内涵数据价值化是指以数据资源化为起点,经历数据资产化、数据资本化阶段,实现数据价值化的经济过程。数据价值化重构生产要素体系,是数字经济发展的基础。生产要素是经济社会生产经营所需的各种资源。农业经济下,农业技术、劳动力、土地构成生产要素组合;工业经济下,工业技术、资本、劳动力、土地构成生产要素组合;数字经济下,数字技术、数据、资本、劳动力、土地构成生产要素组合。数据作为数字经济全新的、关键的生产要素,贯穿于数字经济发展的全部流程,与其他生产要素不断组合迭代,加速交叉融合,引发生产要素多领域、多维
8、度、系统性、革命性群体突破。一方面,价值化的数据要素将推动技术、资本、劳动力、土地等传统生产要素发生深刻变革与优化重组,赋予数字经济强大发展动力。数据要素与传统生产数据价值化与数据要素市场发展报告(2021 年)2要素相结合,催生出人工智能等“新技术”、金融科技等“新资本”、智能机器人等“新劳动力”、数字孪生等“新土地”,生产要素的新组合、新形态将为推动数字经济发展不断发挥放大、叠加、倍增效应。另一方面,数据价值化直接驱动传统产业向数字化、网络化、智能化方向转型升级。数据要素与传统产业广泛深度融合,乘数倍增效应凸显,对经济发展展现出巨大价值和潜能。数据资源化是使无序、混乱的原始数据成为有序、有
9、使用价值的数据资源。数据资源化阶段包括通过数据采集、整理、聚合、分析等,形成可采、可见、标准、互通、可信的高质量数据资源。数据资源化是激发数据价值的基础,其本质是提升数据质量、形成数据使用价值的过程。数据资产化是数据通过流通交易给使用者或所有者带来经济利益的过程。数据资产化是实现数据价值的核心,其本质是形成数据交换价值,初步实现数据价值的过程。数据资本化主要包括两种方式,数据信贷融资与数据证券化。数据信贷融资是用数据资产作为信用担保获得融通资金的一种方式,如数据质押融资。数据证券化是以数据资产未来所产生的现金流为偿付支持,通过结构化设计进行信用增级,发行可出售流通的权利凭证,获得融资的过程,数
10、据证券化方式较为多样,包括 IPO、重组并购、D-ABS(即数据资产证券化)、D-ABN(即数据资产支持票据)等。数据资本化是拓展数据价值的途径,其本质是实现数据要素的社会化配置。(二)数据要素市场概念内涵(二)数据要素市场概念内涵数据价值化与数据要素市场发展报告(2021 年)3数据要素市场是数据要素在交换或流通过程中形成的市场。要素是指构成事物的必要因素或系统的组成部分,生产要素是生产系统的组成部分,是维持企业生产经营活动所必须具备的基本因素,市场则包含两种含义,其一是交易场所,其二为交易行为的总称。数据要素市场既包括数据价值化过程中的交易关系或买卖关系,也包括这些数据交易的场所或领域。完
11、善数据要素市场是建设统一开放、竞争有序市场体系的重要部分,是坚持和完善社会主义基本经济制度、加快完善社会主义市场经济体制的重要内容。深化数据要素市场化配置改革,促进数据要素自主有序流动,破除阻碍数据要素自由流动的体制机制障碍,推动数据要素配置依据市场规则、市场价格、市场竞争实现效益最大化和效率最优化,有利于进一步激发市场创造力和活力,贯彻新发展理念,最终形成数据要素价格市场决定、数据流动自主有序、数据资源配置高效公平的数据要素市场,推动数字经济发展质量变革、效率变革、动力变革。二、数据价值化的现状和进展(一)数据资源化方兴未艾(一)数据资源化方兴未艾数据资源化是数据价值化的首要阶段,包括数据采
12、集、数据整理、数据聚合、数据分析等。数据采集是根据需要收集数据的过程,数据整理包括数据标注、清洗、脱敏、脱密、标准化、质量监控等,数据聚合包括数据传输、数据存储、数据集成汇聚等,数据分析是为各种决策提供支撑而对数据加以详细研究和概括总结的过程。数据价值化与数据要素市场发展报告(2021 年)4资料来源:中国信息通信研究院图 1 数据资源化框架图全球蕴含海量数据资源。根据国际数据公司(IDC)发布的数据时代 2025 显示,2025 年全球每年产生的数据将从 2018 年的 33ZB(1ZB=10 万亿亿字节)增长到 175ZB,相当于每天产生 491EB(1EB=1.1529e+18 字节)的
13、数据。新一代信息技术的迅速发展与普及、全球数据的“井喷式”生产、数据收集存储和处理成本的大幅下降、机器计算能力的大幅提高,为数据资源化奠定了基础。数据价值化与数据要素市场发展报告(2021 年)5数据来源:IDC、Seagate、Statista estimates图 2 全球每年产生数据量及增速图全球已初步形成较为完整的数据资源供应链,数据采集、数据标注、时序数据库管理、数据存储、商业智能处理、数据挖掘和分析、数据交换等技术领域迅速成长发展。全球看,即使欧美日韩等发达国家,仍处于数据资源化的初级阶段。目前,我国已在数据采集、数据标注环节初步形成了产业体系,数据管理和数据应用能力不断提升。1.
14、数据采集产业现状数据采集是数据资源化的首要环节,是数据标注、数据清洗、数据存储、数据分析等的基础。数据采集行业产品应用广泛,如电子商务行业通过对商品类别、名称、价格等信息进行数据采集和分析,构建商品比价系统,金融行业通过收集用户的个人交易数据,对用户的征信和贷款进行评级等。数据采集行业主体主要包括采集设备提供商、数据采集解决方案提供商两类。数据价值化与数据要素市场发展报告(2021 年)6数据采集设备提供商为数据采集提供传感器、采集器等专用采集设备和智能设备。如工业数据采集通过智能装备本身或加装传感器方式采集生产现场数据,包括设备(如机床、机器人)数据、产品(如原材料、在制品、成品)数据、过程
15、(如工艺、质量等)数据、环境(如温度、湿度等)数据、作业数据(现场工人操作数据,如单次操作时间)等,采集的数据用于工业现场生产过程的可视化和持续优化,实现智能化的决策与控制。数据采集解决方案提供商通过人工采集服务、系统日志采集系统、网络数据采集系统等方式为客户提供解决方案。人工采集对象主要包括语音数据、图像数据、视频数据等。语音采集通过采集不同人群的普通话、方言、英文和小语种等各类语音音频,可应用于智能家居、智能设备、智能客服、智慧门店等场景落地。图像采集通过人工拍摄包括人像、商品、汽车、风景等各类真实生活中的图像,助力图像识别模型的训练,可应用于智慧零售、智能设备等场景。视频采集通过人工拍摄
16、指定的物体、人脸、安防等场景的视频,满足多角度、多光线、多场景的多样化采集要求,可在智能安防、智能设备、智慧金融等视觉场景落地。以百度众测为例,其拥有 1 万名专职外场数据采集员,覆盖 40 多个国家和地区,遍布全国 300+城市,通过其众包平台向数据采集员分配任务,短期内满足客户采集需求。系统日志是记录系统中硬件、软件和系统问题的信息,同时还可以监视系统中发生的事件,用户通过分析系统日志来检查错误发生的数据价值化与数据要素市场发展报告(2021 年)7原因或者寻找设备受到攻击时攻击者所留下的痕迹。互联网公司每天都会产生大量的日志,这些日志一般为流型数据,比如搜索引擎的页面浏览量、查询量,数据
17、量非常庞大。通过进行比对分析和数据挖掘,能够帮助企业更精准的了解用户情况,了解设备的运行情况及安全状态,能够帮助企业提高对用户的服务能力,进而提升营销策略,实现智能运维和统一管控。网络数据采集包括通过网络爬虫等方式获取数据,对象主要是各类网站,包括新闻类、社交类、购物类以及相应的一些 API、用户接口和一些流型数据。网站 Website、API、流型数据是目前网络爬虫主要爬取的三大类对象,其中Website网站数据是网络爬虫的首要对象。2.数据标注产业现状根据美国领先的调查机构Grand View Research的一项最新报告,全球(包括美国英国中国等十国)数据标注工具市场规模在 2019
18、年的收入为 3.9 亿美元,预计 2020 年至 2027 年复合年均增长率将达26.9%。目前全球已有比较成熟的数据标注企业,如 Appen、iMerit、Infolks,数据标注众包平台如 Playment、Scale AI、Clickworker。现有数据标注以人工标注为主,属于劳动密集型产业,考虑到用工成本,除隐私数据外,欧美国家一般将标注工作转移至第三世界国家,马来西亚、泰国、印度等国家都有欧美数据标注企业分公司。随着机器学习不断完善,自动标注成为大趋势,Google、Microsoft 等互联网公司相继推出了自动标注系统,利用计算机来完成对部分数据的标注。数据标注市场的头部企业通过
19、合作打造新的战略伙伴关系,扩大市场份数据价值化与数据要素市场发展报告(2021 年)8额,如 Playment 和 Scale AI 两家提供商合作,为全球高分辨率 LiDAR传感器制造商 Data 联合开发了高级深度学习标注工具。中国企业在2005年以后逐步涉足标注产业,尤其是2010年以后,随着人工智能巨头的崛起,数据标注和采集需求激增,数据标注市场逐渐形成,其提供的数据标注服务中,文本标注较为基础,多以语音标注、计算机视觉标注为主。从运营模式来看,数据标注企业通过三类模式提供标注服务。众包模式通过搭建众包平台,汇聚数据标注兼职人员力量,成为数据需求方和兼职数据标注员的中介。众包模式有利于
20、节省企业运营成本,但公司对兼职人员管理较为困难,质量难以把控,现有发展较好的众包企业有蚂蚁众包、阿里众包等。自建模式通过自建标注工厂或基地,提供数据标注服务。自建模式有稳定的数据标注员,可以保障专业性和数据质量。但该类数据标注公司大都规模较小,业务承载能力有限,且在项目断档情况下成本压力较大,市场上具有一定规模的专业数据标注公司有 Testin 云测、倍赛、梦动科技、标贝科技等。组合模式将众包模式与自建模式相结合。一方面是互联网公司加入数据标注市场,由于其资本雄厚、自身数据需求强、用户基数大,可凭借自建的标注基地、科学的众包任务分发模式、智能化的数据采集与标注工具,实现规模效应和高效作业。如,
21、百度在山西建立人工智能基础数据产业基地,百度众测推出数据标注开放平台;京东在山东设京东众智大数据标注助残基地,推出 Wise 开放标注平台。另一方面,随专注数据运营的企业规模扩大,可根据项目大小和客户保密要求灵活部署,将数据价值化与数据要素市场发展报告(2021 年)9众包和自建模式相结合。如,数据堂成立了合肥数据基地、保定数据基地,运营数加加众包平台;龙猫数据在河南、安徽等十二省建立数据标注基地,运营龙猫众包平台。资料来源:中国信息通信研究院图 3 头部数据标注企业概况图从垂直市场来看,数据标注市场可大致分成智能驾驶、智慧家居、医疗卫生、金融服务、新零售、安防和其他领域。近年来,智能驾驶、智
22、慧家居发展迅速,尤其是医疗卫生行业对数据标注的需求显著增长。目前,人工智能技术正被广泛应用于药物开发、基因测序、治疗预测和诊断自动化等领域。数据标注有助于获得支持人工智能技术发展的准确数据,其质量直接影响人工智能应用中算法的准确性和有效性,有望推动医疗卫生行业的智能化发展,同时也意味着未来数据标注市场的门槛会逐步提高,数据标注将由简单标注到复杂标注升级。数据价值化与数据要素市场发展报告(2021 年)10从区域分布来看,数据标注已形成以北京为增长极辐射带动三大产业增长带的区域格局。现有的数据标注头部企业有 75%总部设在北京,主导了数据标注产业的发展,成为行业增长极,通过技术和业务联系,数据标
23、注产业形成了 T 字市场结构,产生了三个增长带:环京产业群、环长三角产业群、环成渝产业群。三大产业带发展,又支撑促进增长极中企业的不断壮大,继而发挥示范效应和扩散效应,吸引初创企业纷纷学习、效仿,从而形成一个螺旋上升的循环累积过程。目前,数据标注产业以人工标注为主,企业在华东、华南、华西的一线城市成立分部,管理周边数据标注业务,其标注基地/工厂大都建立在劳动力资源密集省市的小城镇和农村,为当地提供大量就业机会,孵化出新疆和田、河南平顶山、信阳光山县,山东菏泽鄄城县,河北涞源县东团堡乡,贵州百鸟河镇等数据标注村。未来,在垂直市场需求不断精细化趋势下,数据标注产业将催生处更加专业化集聚化的产业集群
24、,数据标注质量和精度也会越来越高。数据价值化与数据要素市场发展报告(2021 年)11资料来源:天眼查、数据标注企业官网图 4 数据标注头部企业基地/工厂区域分布(二)数据资产化加速推进(二)数据资产化加速推进数据资源化使种类丰富且内容庞杂的数据拥有了使用价值,发展潜力十分巨大。数据资产化,使具有使用价值的数据成为一种资产,在市场上进行流通交易,给拥有者或使用者带来经济利益。数据资产化是构建数据要素市场的关键与核心,包括数据权属的确定、数据资产的定价、数据的交易流通。1.全球数据权属探索现状针对数据确权,全球各国在法律制度上进行了不同探索。欧盟最早进行体系性构建,通过一般数据保护条例(GDPR
25、)和非个人数据在欧盟境内自由流动框架条例,确立了“个人数据”和“非个人数据”的二元架构。针对任何已识别或可识别的自然人相关的个人数据价值化与数据要素市场发展报告(2021 年)12数据,其权利归属于该自然人,其享有包括知情同意权、修改权、删除权、拒绝和限制处理权、遗忘权、可携权等一系列广泛且绝对的权利。针对个人数据以外的非个人数据,企业享有数据生产者权,不过其权利并非是绝对的。美国依托现有制度,加大对数据隐私的保护。美国并无针对数据的综合立法,而是将个人数据置于传统隐私权的架构下,利用“信息隐私权”来化解互联网对私人信息的威胁。同时通过公平信用报告法、财务隐私法、有线通信信息法、健康保险携带和
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 价值 要素 市场 发展 报告 2021
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【宇***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【宇***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。