2021隐私计算白皮书.pdf
《2021隐私计算白皮书.pdf》由会员分享,可在线阅读,更多相关《2021隐私计算白皮书.pdf(55页珍藏版)》请在咨信网上搜索。
1、 隐私计算白皮书(2021 年)隐私计算联盟中国信息通信研究院云计算与大数据研究所2021 年 7 月编写委员会 主要编写单位主要编写单位(排名不分先后):中国信息通信研究院云计算与大数据研究所、上海富数科技有限公司、蚂蚁科技集团股份有限公司、华控清交信息科技(北京)有限公司、北京数牍科技有限公司、零知识科技(北京)有限公司、深圳市腾讯计算机系统有限公司、联易融数字科技集团有限公司 参与编写单位参与编写单位(排名不分先后):洞见智慧科技有限公司、北京冲量在线科技有限公司、天翼电子商务有限公司(电信翼支付)、天翼云科技有限公司、交通银行股份有限公司、上海阵方科技有限公司、京东科技控股股份有限公司
2、、北京瑞莱智慧科技有限公司、华为云计算技术有限公司、蓝象智联(杭州)科技有限公司、北京融数联智科技有限公司、神谱科技(上海)有限公司、翼健(上海)信息科技有限公司、杭州锘崴信息科技有限公司、杭州趣链科技有限公司、优刻得科技股份有限公司、医渡云(北京)技术有限公司、深圳致星科技有限公司(星云Clustar)、上海浦东发展银行股份有限公司、中国光大银行股份有限公司、同盾科技有限公司、零幺宇宙(上海)科技有限公司、牛津(海南)区块链研究院有限公司、西安纸贵互联网科技有限公司 本报告的法律合规部分还得到了世辉律师事务所、腾讯研究院、广东君信律师事务所法律专家的审阅。编写组主要成员编写组主要成员(排名不
3、分先后):袁 博 闫 树 吕艾临 王思源 仵姣姣 魏 凯 姜春宇 刘嘉夕 靳 震 叶锦梅 李雪妮 卞 阳 黄翠婷 孙小超 王 磊 殷 山 昌文婷 任维赫 李 艺 王国赛 黄丽成 金银玉 单进勇 蔡超超 苏冠通 徐茂桐 李 南 程 勇 刘 江 刘淑珍 许 焱 陈 曦 姚 明 李 博 王湾湾 陈浩栋 周岳骞 章 庆 徐 潜 王益斌 刘天琪 王光中 谢 谨 夏伏彪 龚自洪 宋红花 孙中伟 雷明禹 徐世真 张 煜 林佳萍 毛仁歆 王 超 薛瑞东 黄小刚 祝文伟 黄程韦 张莺耀 范家璇 王 爽 李 帜 徐 静 汪小益 马 强 何永德 包仁义 黄 尧 杨 柳 马文婷 黄小芮 黄登玺 刘 巍 李晓林 彭宇翔
4、 张 威 王江凌 于 昇 杨文韬 杨 珍 I 前言前言 2020 年 4 月,中共中央、国务院发布关于构建更加完善的要素市场化配置体制机制的意见,将数据同土地、劳动力、资本、技术等传统生产要素并列,作为一种新型生产要素参与分配。作为释放要素价值的关键环节,数据资源的开放共享、交换流通成为重要趋势,其需求日益增加。然而,近年来数据安全事件频发,数据安全威胁日益严峻。特别是中华人民共和国数据安全法的颁布和实施,对企业合规安全地发挥数据价值提出了更高的要求。既要应用数据,又要保护安全,如何兼顾发展和安全,平衡效率和风险,在保障安全的前提下发挥数据价值,是当前面临的重要课题。以多方安全计算、联邦学习、
5、可信执行环境等为代表的隐私计算技术为流通过程中数据的“可用不可见”提供了解决方案,已在一些领域开始推广应用。可以说,隐私计算是在实现保护数据拥有者的权益安全及个人隐私的前提下,实现数据的流通及数据价值深度挖掘的一类重要方法。近两年来,在政策驱动和市场需求同时作用下,隐私计算技术、产业、应用迅速发展,成为商业和资本竞争的热门赛道。2020 年底,中国信通院在工业和信息化部相关司局的指导下,联合业界六十余家技术企业和应用单位成立隐私计算联盟,成为隐私计算领域的重要行业组织。2021 年,中国信通院云大所联合隐私计算联盟的三十余家企业共同完成了这本隐私计算白皮书(2021 年)。本白皮书试图回答以下
6、这些问题:II 隐私计算是什么:为什么会有隐私计算技术?它能发挥什么价值?面临什么样的政策环境?隐私计算技术发展情况:隐私计算的技术体系是怎样的?各类隐私计算技术的方案架构和特点有哪些?每种隐私计算技术擅长解决的问题是什么?其成熟度和缺陷有哪些?技术融合与扩充的情况如何?隐私计算应用场景:隐私计算常用的应用场景有哪些?在每个场景里,隐私计算解决了什么痛点、如何应用?隐私计算产业发展情况:国内外隐私计算主要有哪些企业?隐私计算行业的商业模式、论文情况、技术开源情况、标准建设情况如何?隐私计算合规性情况:从法律视角看,隐私计算解决了哪些数据流通的合规性问题?应用隐私计算过程中,面临哪些合规性风险?
7、如何解决这些风险?隐私计算面临的问题与挑战:隐私计算的发展面临哪些问题?这些问题该如何改善?道阻且长,行则将至;行而不辍,未来可期。面对这个日新月异、快速发展的行业,我们期待与业界共同守正创新,推动隐私计算行业健康发展,让隐私计算在数据要素市场建设和数据流通过程中发挥更大的价值!III 目录目录 第一章 隐私计算概述.1(一)数据流通需求推动隐私计算势头火热.1(二)政策环境为隐私计算发展提供新机遇.2 第二章 隐私计算技术发展态势.5(一)隐私计算技术体系基本建立.5(二)多方安全计算基于密码学原理实现通用计算能力.6(三)联邦学习变革机器学习范式广泛应用于联合建模.9(四)可信执行环境依托
8、于可信硬件提供高效计算方案.12(五)相关技术扩充隐私计算技术体系.15 第三章 隐私计算主要应用场景.18(一)联合营销:跨行业数据融合重构用户画像.18(二)联合风控:引入外部数据优化金融风控模型.20(三)智慧医疗:数据互通发挥医学数据价值.21(四)电子政务:促进政务数据安全共享开放.21 第四章 隐私计算产业发展态势.23(一)隐私计算市场发展迅速.23(二)产业发展配套环境正在逐步完善.26 第五章 隐私计算合规探讨.33(一)隐私计算有助于提升数据流通的合规性.33(二)隐私计算方案设计需要关注合规要求.34 IV (三)隐私计算合规实践路径的探索.35 第六章 隐私计算的挑战和
9、难题.37(一)安全性挑战影响市场信任.37(二)性能瓶颈阻碍隐私计算规模化应用.38(三)互联互通壁垒或使数据“孤岛”变“群岛”.39 第七章 隐私计算发展展望.41(一)算法优化和硬件加速将成为隐私计算可用性提升的重要方向.41(二)多元技术融合有望拓展隐私计算应用边界.42(三)标准体系制定有望助力隐私计算应用落地.43(四)多方生态融合有望推进隐私计算行业发展.44 附录 国内主要隐私计算平台.45 1 第一章 隐私计算概述隐私计算概述 隐私计算(Privacy-preserving computation)是指在保证数据提供方不泄露原始数据的前提下,对数据进行分析计算的一系列信息技术
10、,保障数据在流通与融合过程中的“可用不可见”。站在数据成为比肩石油的基础性关键战略资源的当下,隐私计算为需求强烈但瓶颈重重的数据流通提供了破局思路。Gartner 发布的2021 年前沿科技战略趋势中,将隐私计算(其称为隐私增强计算)列为未来几年科技发展的九大趋势之一。随着各方关注度的提升,隐私计算已成为发展火热的新兴技术,跻身商业和资本竞争的热门赛道。(一一)数据流通需数据流通需求推动隐私计算势头火热求推动隐私计算势头火热 数字经济时代的特点之一便是将数据视作关键的生产要素,并通过跨领域、跨行业、跨地域的机构间数据流通释放要素价值。但是,目前我国数据要素市场化配置尚处于起步阶段,规模小、成长
11、慢、制约多,机构间的数据流通仍存在诸多阻碍。一是数据权属的界定仍不明确一是数据权属的界定仍不明确,在相关立法和制度尚未健全的当下,实践中并未能形成具有共识性的权属分割规则,产权争议、难以监管的风险令供需双方望而却步。二是数据流通的安全风险高,二是数据流通的安全风险高,数据安全事件频发,出于对国家安全、个人信息和商业秘密的保护,企业参与数据流通的主动性、积极性因此降低。三是如何确保流通过程的三是如何确保流通过程的 2 安全合法仍然较难把握安全合法仍然较难把握。现有监管要求并未给出数据对外提供和处理的明确合法依据与参考指引,企业依然困惑于数据可流通的对象、范围、方式等一系列问题。除此之外,数据流通
12、在数据质量、数据定价等方面也都面临着诸多挑战。为解决上述障碍,政府部门和大数据行业从业者进行了艰辛的探索,寻求通过技术手段解决个人信息保护、权益分配、数据安全保障、追溯审计等难题。针对较为核心的个人信息保护,业界通过数据标识加密技术、数据标识关联技术和有效授权技术等为确保敏感信息不可实别和确保数据仅在授权范围内使用提供了一定的思路。但是,以上技术仍不能抵御数据流通后被反推和滥用的风险,而“可用不可见”的隐私计算正是解决这一问题的技术突破口。从技术原理讲,隐私计算并不能简单归属于某一个学科领域,而是一套融合了密码学、安全硬件、数据科学、人工智能、计算机工程等众多领域的跨学科技术体系,包含了多方安
13、全计算、联邦学习和可信执行环境等不同的代表性技术方案。从应用目的讲,一方面隐私计算可以增强数据流通过程中对个人标识、用户隐私和数据安全的保护;另一方面隐私计算也为数据的融合应用和价值释放提供了新思路。(二)政策环境为隐私计算发展提供新(二)政策环境为隐私计算发展提供新机遇机遇 近年来我国数据立法进程不断加快,尤其强调数据应用过程中的数据安全。中华人民共和国网络安全法 中华人民共和国数据安全法和中华人民共和国个人信息保护法(草案)逐步完善了国家数据相关立法的顶层设计,着重强调了流通过程中的数据安全和个人 3 信息保护。隐私计算是平衡数据利用与安全的重要路径。自 2016 年,工业和信息化部、中国
14、人民银行、国家发改委、中央网信办、国家能源局等各部委先后在相关政策文件中提出加强隐私计算相关技术的攻关和应用。人民银行于 2021 年 5 月组织金融机构开展包括应用隐私计算进行数据共享在内的金融数据综合应用试点。在地方政府层面,广东省于 7 月发布的数据要素市场化配置改革行动方案中提出构建包含隐私计算在内的数据新型基础设施。政策的提前布局对于我国抢占隐私计算技术和应用关键领域奠定了良好基础。表表 1:相关法律及政策文件梳理:相关法律及政策文件梳理 时间时间 文件名文件名 发布单位发布单位 简述简述 法法律律 2016 年 11 月 中华人民共和国网络安全法 十二届全国人大常委会第二十四次会议
15、 强调对收集的用户信息严格保密,维护网络数据的完整性、保密性和可用性,实行网络安全等级保护制度 2021 年 4 月 中华人民共和国个人信息保护法(草案)十三届全国人大常委会第二十八次会议 强调个人信息在数据流通过程中的安全合规 2021 年 6 月 中华人民共和国数据安全法 十三届全国人大常委会第二十九次会议 强调数据安全与开发利用并重,确立数据分类分级管理制度,多种手段保证数据交易合法合规 政政策策文文件件 2016 年 12 月 大数据产业发展规划(2016-2020 年)工业和信息化部 支持企业加强多方安全计算等数据流通关键技术攻关和测试验证 2019 年 9 月 金融科技(FinTe
16、ch)发 展 规 划(2019-2021年)中国人民银行 提出利用多方安全计算技术提升金融服务安全性 2019 年 9 月 工业大数据发展指导意见(征求意见稿)工业和信息化部 提出在工业领域积极推广多方安全计算技术,促进工业数据安全流通 2021 年 5 月 全国一体化大数据中心协同创新体系算力枢纽实施方案 国家发改委、中央网信办、工业提出“试验多方安全计算、区块链、隐私计算、数据沙箱等技术模式,构建数据可 4 和信息化部、国家能源局 信流通环境,提高数据流通效率”2021 年 7 月 网络安全产业高质量发展三年行动计划(2021-2023 年)(征求意见稿)工业和信息化部 提出推动隐私计算等
17、数据安全技术的研究攻关和部署应用,促进数据要素安全有序流动 2021 年 7 月 广东省数据要素市场化配置改革行动方案 广东省人民政府 提出构建包含隐私计算在内的数据新型基础设施 技术价值的凸显,再加上政策环境的助力,隐私计算在数据相关产业内悄然兴起,相关的学术会议和论文在近几年呈现大幅增长,相关研究从技术原理逐步转向应用实践。在算法协议不断优化、硬件性能逐步增强之下,隐私计算的可用性大大提升,越来越多的企业入局隐私计算的研发和产品化,金融风控、互联网营销、医疗诊治、智慧城市等越来越多的场景落地应用。目前,隐私计算已成为数据流通领域内最受关注的技术热点,市场一片火热。5 第二章 隐私计算技术发
18、展态势隐私计算技术发展态势 从 20 世纪 70 年代一直到近年,隐私计算交叉融合了密码学、人工智能、计算机硬件等众多学科,逐渐形成以多方安全计算、联邦学习、可信执行环境为代表,混淆电路、秘密分享、不经意传输等作为底层密码学技术,同态加密、零知识证明、差分隐私等作为辅助技术的相对成熟的技术体系,为数据安全合规流通提供了技术保障。(一)(一)隐私计算技术体系基本建立隐私计算技术体系基本建立 从技术角度出发,隐私计算是涵盖众多学科的交叉融合技术,目前主流的隐私计算技术主要分为三大方向:第一类是以多方安全计算为代表的基于密码学的隐私计算技术;第二类是以联邦学习为代表的人工智能与隐私保护技术融合衍生的
19、技术;第三类是以可信执行环境为代表的基于可信硬件的隐私计算技术。不同技术往往组合使用,在保证原始数据安全和隐私性的同时,完成对数据的计算和分析任务。图图 1 隐私计算技术体系隐私计算技术体系 6 隐私计算技术为数据的隐私保护与计算提供丰富的解决方案,可从底层硬件、基础层和算法应用等不同角度加以区分。如图 1 所示,从底层硬件来说,从底层硬件来说,多方安全计算与联邦学习通常从软件层面设计安全框架,以通用硬件作为底层基础架构;可信执行环境则是以可信硬件为底层技术实现的隐私计算方案。从从算法算法构造来说,构造来说,多方安全计算技术基于各类基础密码学工具设计不同的安全协议;联邦学习除可将多方安全计算协
20、议作为其隐私保护的技术支撑外,基于噪声扰动的差分隐私技术也广泛应用于联邦学习框架中;可信执行环境通常与一些密码学算法、安全协议相结合为多方数据提供保护隐私的安全计算。从算法应用来说,从算法应用来说,以不同技术为基础,隐私计算逐渐演化出丰富的算法应用场景。这些应用往往为了实现特定计算目的而组合应用了多种隐私计算技术,可更直接用于实际生产。联邦学习技术方案主要应用于联合建模和预测场景中;多方安全计算和可信执行环境则可作为更加通用的技术方案,可设计用于联合统计、联合查询、联合建模及联合预测等诸多场景。还需要指出的是,隐私计算技术体系还在快速发展中。以上划分只是一种业界常用的分类方法。目前各类技术也在
21、互相融合,有望在更广泛的场景中发挥作用。(二)(二)多方安全计算基于密码学原理实现通用计算能力多方安全计算基于密码学原理实现通用计算能力 1.基本方案架构基本方案架构 多方安全计算(Secure Multi-party Computation,MPC)由图灵奖 7 获得者姚期智院士于 1982 年通过提出和解答百万富翁问题而创立,是指在无可信第三方的情况下,多个参与方共同计算一个目标函数,并且保证每一方仅获取自己的计算结果,无法通过计算过程中的交互数据推测出其他任意一方的输入数据(除非函数本身可以由自己的输入和获得的输出推测出其他参与方的输入)。图图 2 多方安全计算技术框架多方安全计算技术框
22、架 如图 2 所示,从底层硬件来说从底层硬件来说,不同于可信执行环境基于可信硬件来保证数据的隐私计算,多方安全计算以通用硬件作为底层架构设计基于密码学的算法协议来实现隐私计算。从算法构造来说从算法构造来说,多方安全计算是多种密码学基础工具的综合应用,除混淆电路、秘密分享、不经意传输等密码学原理构造的经典多方安全计算协议外,其它所有用于实现多方安全计算的密码学算法都可以构成多方安全计算协议,因此在实现多方安全计算时也应用了同态加密、零知识证明等密码学算法(鉴于同态加密、零知识证明在隐私计算中的特殊地位,后面我们将单独叙述),有时也与可信执行环境等基于可信硬件的隐私计算技术结合提供安全加强的方案。
23、从算法应用来说从算法应用来说,多方安全计算根据其可在各方不泄露输入数据的前提下完成多方协同分析、处理和结果发布这一技术特点,广泛应 8 用于联合统计、联合查询、联合建模、联合预测等场景,也可以支持用户自定义计算逻辑的通用计算需求。2.相关分析相关分析 从协议实现角度分析,在基于多方安全计算的隐私计算领域,从协议实现角度分析,在基于多方安全计算的隐私计算领域,被被广泛应用的广泛应用的有混淆电路、秘密分享和不经意传输有混淆电路、秘密分享和不经意传输等基础等基础密码学密码学技术技术。混淆电路混淆电路(Garbled Circuit,GC)协议的思想起源于姚期智院士针对百万富翁问题提出的混淆电路解决方
24、案,因此也被称为“姚氏电路”。混淆电路使用布尔电路构造安全函数计算,保证一方输入不会泄漏给其他方,计算出结果,并能指定结果由哪方获得或者是两方以分片形式共有。该技术可实现各种计算,常用于通用计算场景,通信量大但通信轮数固定,适用于高带宽高延迟场景。秘密分享秘密分享(Secret Sharing,SS)协议最早由 Shamir 和 Blakley 在1979 年提出,是指将秘密信息拆分成若干分片,由若干参与者分别保存,并且通过参与者的合作,对分布式存储的各分片进行安全计算,全部分片或达到门限数的分片根据多个份额可重新恢复秘密信息。秘密分享计算量小、通信量较低,构造多方加法、乘法以及其他更复杂的运
25、算有特别的优势,能实现联合统计、建模、预测等多种功能。不经意传输不经意传输(Oblivious Transfer,OT)协议由 Rabin 于 1981 年首次提出,指数据发送方有 n 个数据,数据接收方接收其选定的一个数据,且不能获取其他数据,同时数据发送方无法知道接收方的选择。不经意传输常用构造多方安全计算协议,是 GMW 协议、混淆电路设计、乘法三元组的基础构件,还可用于实现隐私集合求交(Private Set 9 Intersection,PSI)、隐私信息检索(Private Information Retrieval,PIR)等多种多方安全计算功能。3.技术特点技术特点 多方安全计
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2021 隐私 计算 白皮书
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【宇***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【宇***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。