![点击分享此内容可以赚币 分享](/master/images/share_but.png)
面向位置数据划分的差分隐私保护研究进展.pdf
《面向位置数据划分的差分隐私保护研究进展.pdf》由会员分享,可在线阅读,更多相关《面向位置数据划分的差分隐私保护研究进展.pdf(8页珍藏版)》请在咨信网上搜索。
1、收稿日期:修回日期:基金项目:科技创新 重大项目()教育部 年第二批产学合作协同育人项目()安徽信息工程学院青年科研基金资助项目()作者简介:韩慧慧()女助教硕士主要研究方向为信息安全:.:/面向位置数据划分的差分隐私保护研究进展韩慧慧 刘晴晴 吴锦华 孟令兵(安徽信息工程学院 计算机与软件工程学院安徽 芜湖)摘要:移动定位技术的发展促进了位置数据的收集和共享导致位置数据集隐私面临泄露风险而现有的隐私保护技术难以抵抗攻击者背景知识的攻击 差分隐私作为一种严格可证明的隐私保护模型可以有效防止任意背景知识攻击 对差分隐私基础理论以及它在位置数据划分的应用进行综述重点阐述了差分隐私预算分配策略和位置
2、数据划分方法并对其方法进行分析总结 在现有技术对比分析的基础上指出了需要进一步深入研究的方向关键词:差分隐私位置数据隐私保护数据划分中图分类号:.文献标识码:文章编号:().引言移动互联网和全球定位技术促进了位置服务发展产生大量的位置信息 此类信息可用于各种数据挖掘任务帮助企业提升用户体验、调整营销策略、为新设施选择最佳位置等 然而这些位置数据中包含敏感信息如果服务提供商直接与研究人员或企业共享数据集轻则泄露用户的家庭住址、兴趣爱好等敏感信息重则威胁用户人身安全 因此如何在享受位置服务带来便利的同时保护自己的位置隐私不被泄露有着重要意义现有的位置隐私保护技术如加密技术、假位置技术、空间匿名技术
3、等大多缺乏严密的隐私概念攻击者从中获取用户的敏感信息可能只需要很少的背景知识 与之相比差分隐私是一种严格可证明和安全控制的方法可以有效地保护用户的隐私 自从它在数据库领域中被提出后就被迅速广泛地引入到其他数据应用领域如推荐系统中应用差分隐私实现个性化推荐信息服务、知识图谱中引入差分隐私以提高嵌入的效用和社第 卷第 期 年 月信 息 工 程 大 学 学 报 .交网络在差分隐私保护下以提高图数据的可用性等近年来差分隐私技术取得了大量研究成果本文在这些最新研究进展的基础上首先介绍差分隐私基本概念、实现机制和基本性质并对差分隐私保护中衡量数据可用性的方法进行总结然后重点阐述差分隐私预算的最新分配方法和
4、位置数据划分方法最后总结和展望基于差分隐私的位置隐私保护面临的主要问题 差分隐私保护模型.差分隐私的定义差分隐私通过加入噪声使数据失真使攻击者无法辨别真实数据是一种严格可证明和定量表示的攻击模型 扰动后的数据保持其数据挖掘功能的同时确保数据隐私受到保护定义 相邻数据集 对于任意两个属性结构相同的数据集 和 如果它们之间至多相差一条数据记录则 和 是相邻数据集记为定义 差分隐私 如果 是一个随机算法是 所有可能输出的结果集是 的子集 对于给定的任意相邻数据集 和 如果算法 满足如式()则称算法 满足 差分隐私保护:()()()()式中 称为差分隐私预算它是一个常数只要它足够小就很难用相同的输出
5、判断查询函数是否在 或 上起作用 一般情况下 时才有意义且越小越能保护隐私但相对来说数据可用性要差些 因此信息安全性和数据可用性两个方面都需要在选取 值时加以考虑差分隐私通过添加噪声来实现隐私保护所需噪声量取决于查询函数的全局灵敏度定义 全局敏感度 假设有 个查询函数:对于任意两个相邻的数据集 和 的全局敏感度如式()所示:()()()式中:表示输出结果最大改变值它是由于删除或添加数据集中的任意数据记录而导致查询结果的变化由查询函数本身决定不依赖于输入的数据集()()是 在数据集 和 上的曼哈顿距离或者称为 阶范数距离.差分隐私的实现机制差分隐私中常用的隐私保护机制是拉普拉斯机制和指数机制分别
6、以输出数值结果和非数值结果为主定理 拉普拉斯机制 对于任意函数:如果随机算法 满足式()则该算法实现 差分隐私保护:()()(/)()式中:拉普拉斯噪声的概率密度函数是()由拉普拉斯噪声引起的方差是(/)/标准方差是(/)/是位置参数 是尺度参数通常/从定理 可知拉普拉斯机制通过引入拉普拉斯噪声加入到查询结果中实现差分隐私保护其中 和 直接影响添加的噪声大小因此如何选择查询函数和隐私预算策略是该机制的关键技术定理 指数机制 对于任意函数:()如果随机算法 以正比于()概率选择输出则说明算法 满足 差分隐私保护其中()为可用性函数它为每个输出 分配一个实值的可用性分数打分越高被选择输出的概率则越
7、大而 为函数()的敏感度从定理 可知指数机制将更高概率分配给更高效用分数的输出这样最终的输出就会接近最优值 因此如何设计可用性函数是指数机制的关键.差分隐私的基本性质串行组合和并行组合是差分隐私的两个基本性质其中串行组合性质是指将各算法序列按顺序组合起来为序列组合算法提供差分隐私保护所提供的隐私保护水平为全部隐私预算的累积并行组合性质是指每个算法序列在不相交的数据集上执行隐私预算不会累积算法序列中隐私预算最大的那个决定了提供的隐私保护水平性质 串行组合 给定一系列关于任意数据集 的差分隐私算法()()()()任意两个算法相互独立且每个()算法均满足 差分隐私这些算法组合起来满足 差分隐私如图
8、所示 信 息 工 程 大 学 学 报 年图 串行组合解析图 性质 并行组合 将任意一个数据集 划分成 个互不相交的子集 设有任意两个相互独立的算法 每个差分隐私算法()()()()均能满足 差分隐私这些算法组合在一起满足差分隐私保护如图 所示图 并行组合解析图 在证明算法是否满足差分隐私保护和隐私预算分配是否合理的情况下上述两个性质在差分隐私中发挥着重要作用.差分隐私保护中衡量数据可用性的方法差分隐私技术进行保护后数据的可用性取决于 值 值越大查询结果中加入的噪声越小数据的可用性就越高但数据的隐私安全性越差反之亦然即数据的可用性与安全性是矛盾的 因此隐私保护的目的是确保较高的隐私保护水平同时提
9、供极其准确的查询结果 为了平衡数据的安全性和实用性如何在耗尽 之前使用最小预算来满足最大数量的查询或如何在给定 的情况下提高查询的准确性都是需要考虑的 现有研究中并没有给出特定的差分隐私数据可用性衡量标准而是通常采用相对误差、绝对误差、方差等来评估差分隐私算法的合理性其中最常用的采用相对误差来衡量假设数据集 是在 上进行的任意查询函数()表示对 的真实结果()表示对 加入噪声后的扰动结果相对误差的定义为:()()()/()其中为了避免()的情况设置一个参数 它的值由用户根据采用的索引结构设置 其相对误差越小越能准确得到查询结果绝对误差的定义为:()()()其绝对误差越大扰动后的查询结果越偏离真
10、实的结果方差是查询准确性的有力指标该方差一般用所选用的差分隐私机制的噪声方差表示 通常查询精度越大方差越小反之则相反 位置数据差分隐私保护差分隐私保护技术的实现主要考虑两个问题一是如何使设计的算法能够满足差分隐私而满足差分隐私的关键技术是隐私预算分配二是如何降低噪声误差提高数据可用性而选择合适的数据划分结构是降低噪声误差的重要途径 因此本文重点介绍差分隐私的预算分配和支持数据划分的索引结构.隐私预算分配差分隐私是一种严格的隐私保护模型独立于任何攻击者的背景知识但其缺点在于每次查询都会消耗隐私预算 如果分配给某个查询的隐私预算越大它的查询结果越准确然而这会增加隐私预算并在查询处理中产生限制 反之
11、如果分配给每个查询的隐私预算过小则添加的噪声会非常大从而导致查询结果的准确性和数据效用很差因此实现差分隐私的关键在于如何合理分配隐私预算 本文分析并总结差分隐私预算分配策略的研究成果将差分隐私分配策略大致分为 类:统 第 期韩慧慧等:面向位置数据划分的差分隐私保护研究进展一策略分配、非统一策略分配和混合策略分配它们之间的分类比较如表 所示表 不同隐私预算分配策略分类比较分配策略方式优点不足统一分配策略均匀预算分配操作简单部分隐私预算被浪费查询结果不太准确非统一分配策略几何预算分配查询精确度较高添加的噪声受到树高度影响自适应预算分配自适应分配隐私预算较灵活只能适应特定的数据应用斐波那契预算分配查
12、询精确度高主要适用于树结构下层节点的计数查询动态预算分配节省隐私预算只适用于近期预测混合分配策略统一和非统一分配策略组合只对敏感数据进行扰动数据可用性好隐私预算重复分配.统一分配策略统一策略分配也称为均匀预算分配它是最早出现的隐私预算分配策略其主要思想是将给定的总的隐私预算平均分成 份这是最简单的一种常用方法但是它会导致一部分隐私预算被浪费一般需要进行后续处理来进一步提高查询精确度其具体描述如算法 所示算法 隐私预算统一分配策略算法输入:原始数据集 给定的隐私预算 输出:扰动后的数据.:/.(/)(/)(/).().输出.非统一分配策略地理空间的不同子区域可能需要不同量的隐私保护如果针对不同子
13、区域再使用统一分配策略来分配隐私预算将导致具有低隐私保护要求的子区域的错误度量明显增加或者具有高隐私保护要求的子区域的隐私度量大幅减少这些促进了隐私预算非统一分配策略的产生 非统一预算分配策略的主要思想是根据用户对隐私安全和数据可用性要求将给定的总的隐私预算划分成大小不同份进行分配其具体描述如算法 所示算法 隐私预算非统一分配策略算法输入:原始数据集 给定的隐私预算 输出:扰动后的数据.:其中.(/)(/)(/).输出 非统一预算分配策略又主要包含几何预算分配、自适应预算分配、动态预算分配和斐波那契预算分配等 几何预算分配是通过预测节点的高度把剩余的隐私预算分配给当前节点的子树从父节点到子节点
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 面向 位置 数据 划分 隐私 保护 研究进展
![提示](https://www.zixin.com.cn/images/bang_tan.gif)
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。